首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
日益泛滥的图像垃圾邮件给互联网用户带来极大的不便,如何对其实施有效过滤成为亟待解决的问题.分析图像垃圾邮件过滤中的关键问题邮件图像的特征提取.利用垃圾邮件重复发送、内容高度相似的特点,提出一种过滤图像垃圾邮件的新方法:提取邮件图像的综合特征值,以此作为目标邮件图像与垃圾邮件图像样本库相似性度量的依据,通过检测其是否相似来实现垃圾邮件图像的过滤.实验中,提取邮件图像的颜色、纹理和形状3种底层特征,其描述方法分别为颜色矩、共生矩阵统计量和不变矩.结果表明该方法对图像垃圾邮件的召回率达到95%以上.  相似文献   

2.
图像中的文本区域为判别图像垃圾邮件提供了重要依据.为了获得图像中的文本区域信息,提出了基于Hough变换提取图像中倾斜文本区域的算法和降低图像背景干扰的八邻域细小边缘去除算法,实现了一种不受图像中文本颜色、字体、大小、位置、方向限制的文本区域的自动提取方法.在包含100幅垃圾图像的数据集上进行提取图像文本区域的实验.实验结果显示,新方法具有良好的文本区域提取性能.  相似文献   

3.
系统以垃圾邮件过滤为目标,设计并实现了一个垃圾邮件过滤系统SpamBlocker.该系统整合规则过滤、贝叶斯分类、病毒检测和黑/白名单等垃圾邮件检测技术,采用评分方法判断邮件的垃圾性,并利用规则过滤给贝叶斯分类提供学习样本,提高了系统对新垃圾邮件的适应性.  相似文献   

4.
基于Boosting算法的垃圾邮件过滤方法研究   总被引:2,自引:2,他引:0  
为解决垃圾邮件过滤的精确度和有效性问题,提出了一种基于邮件内容过滤的垃圾邮件过滤方法,该方法采用Boosting算法构造了一种垃圾邮件过滤器,利用该垃圾邮件过滤器实现对垃圾邮件的过滤. 本文借鉴文本分类和信息检索领域所使用的评价指标,构建了垃圾邮件过滤器的评价体系,利用该评价体系,针对基于Boosting算法所构造的垃圾邮件过滤器对垃圾邮件的过滤实验所得到的数据进行了测试和评估,测试和评估的结果验证了Boosting算法在垃圾邮件过滤中的有效性,其性能优于传统的贝叶斯算法.   相似文献   

5.
文档图像分割技术研究   总被引:2,自引:0,他引:2  
在文档图像分析处理中,分割技术十分必要.本文介绍了目前文档图像分割算法中常用的特征和方式,并对针中文文档图像给出了一种分割方法.该方法首先利用Sobel算子粗略检测出文字边缘区域,利用形态学膨胀方法扩展该区域,接着进行了两次颜色聚类分析,最后根据中文字符的特征进行了一系列启发式处理,很好地分割出了文字区域.  相似文献   

6.
提出一种过滤垃圾电子邮件的方法.通过tf-idf特征提取方法提取邮件的词汇特征,采用χ2特征选择方法选取有效的特征,并抽取几个具有明显区分能力的结构方面的特征,利用支持向量机算法对垃圾电子邮件进行自动过滤.对中科院中文垃圾邮件语料库(Cspam)的实验,识别正确率达到82%以上,另外,tf-idf词汇特征和结构特征搭配使用可以提高分类的正确率,表明此种方法能提高垃圾电子邮件过滤的准确性.  相似文献   

7.
一种基于自适应小波不变矩的色情图像过滤方法   总被引:3,自引:0,他引:3  
随着互联网络和多媒体技术的发展,色情图像在网络上的传播越来越泛滥,该文旨在研究如何有效过滤这些色情图像.该文提出一种基于自适应小波不变矩的皮肤纹理检测方法,首先利用统计颜色空间模型分割出疑似皮肤区域,再利用自适应小波不变矩来描述皮肤的纹理特征,该特征具有平移和缩放不变性.最后将该方法用于色情图像的过滤,通过对752幅色情图像和5 000幅正常图像的过滤实验,结果表明该方法具有较好的准确率和检出率.  相似文献   

8.
图像中文字信息的提取和识别具有极大的应用价值,文字定位是文字提取最关键的步骤之一.现有文字定位算法复杂度高,查全率和查准率都有待提高.本文提出一种基于频域纹理特征的图像文字定位方法.在图像频域提取纹理特征后初步定位文字区域,再根据文字区域的几何属性得到最后的定位结果.实验结果证明,该方法在粗定位和精确定位阶段均能取得较好的效果,且计算复杂度较低.  相似文献   

9.
随着internet的快速发展,垃圾邮件泛滥成灾.面对垃圾邮件日益严重的现状,提出了贝叶斯邮件过滤模型并讨论了贝叶斯分类方法在垃圾邮件过滤中的应用.针对难以获得大量有类别标签的邮件训练集问题,利用贝叶斯具有增量学习特征,分析并提出了基于小规模训练集的贝叶斯增量邮件过滤方法,通过最小化当前邮件分类器的分类损失,来选择有利于提高分类器性能的邮件加入训练集.实验结果表明,该方法是切实可行的并具有良好的效果.  相似文献   

10.
垃圾邮件是长期以来困扰电子邮件使用者的一个问题,反垃圾邮件技术除了可以抑制垃圾邮件,对反垃圾短信和垃圾VoIP电话等问题也有借鉴意义. 为此,对使用贝叶斯方法过滤垃圾邮件进行了介绍,阐述了中文垃圾邮件过滤系统的实现,并给出了评估结果. 结果表明,在过滤中计算最终概率的特征数目以及用于训练的样本个数都存在某个最优值,当用于训练的样本个数逐渐超过这个最优值时,过滤效果会略微下降并趋于一致.  相似文献   

11.
基于序列图像的全景图像拼接   总被引:9,自引:0,他引:9  
基于图像建模和绘制的虚拟环境构造是近年来虚拟现实技术研究的热点。其中基于序列图像的全景图像拼接技术研究是虚拟环境临场感的一个关键因素,文章以普通照相机拍摄的序列图像为基础,通过相邻两幅序列图像差值图像极值点的搜寻,可以快速提取两幅序列图像之间的重叠部分,并采用线性加权法使得缝合后的图像自然、逼真。最后给出了本算法在PC机拼接的效果图。  相似文献   

12.
In recent years, multimedia annotation problem has been attracting significant research attention in multimedia and computer vision areas, especially for automatic image annotation, whose purpose is to provide an efficient and effective searching environment for users to query their images more easily.In this paper, a semi-supervised learning based probabilistic latent semantic analysis ( PL-SA) model for automatic image annotation is presenred.Since it' s often hard to obtain or create la-beled images in large quantities while unlabeled ones are easier to collect, a transductive support vector machine ( TSVM) is exploited to enhance the quality of the training image data.Then, differ-ent image features with different magnitudes will result in different performance for automatic image annotation.To this end, a Gaussian normalization method is utilized to normalize different features extracted from effective image regions segmented by the normalized cuts algorithm so as to reserve the intrinsic content of images as complete as possible.Finally, a PLSA model with asymmetric mo-dalities is constructed based on the expectation maximization( EM) algorithm to predict a candidate set of annotations with confidence scores.Extensive experiments on the general-purpose Corel5k dataset demonstrate that the proposed model can significantly improve performance of traditional PL-SA for the task of automatic image annotation.  相似文献   

13.
基于分层密度特征的文档图像检索   总被引:1,自引:0,他引:1  
为克服基于版面重建的文档图像检索方法对图像质量要求高,且局限于部分文种,以及基于版面分割的文档图像检索方法受限于版面分割技术等问题,提出了一种基于二值文档图像分层密度特征的检索方法。该方法通过倾斜校正、去除黑边等预处理得到有效文本区域,提取有效文本区域的长宽比和分层密度特征,通过特征比对进行检索。实验表明:该方法对不同分辨率以及不同的输入设备具有自适应能力,对复杂版面和批注等噪声鲁棒性好,漏检率为2%,是一种简单有效的文档图像检索方法。  相似文献   

14.
反垃圾邮件技术综述   总被引:1,自引:0,他引:1  
垃圾邮件已成为互联网上巨大的危害之一,引起了社会的广泛关注和研究人员的深入研究.企业消耗在垃圾邮件上的成本逐日攀升。本文首先介绍了垃圾邮件发送手段,然后综述了目前反垃圾邮件常用的五种技术.它们分别是:基于规则的垃圾邮件过滤,基于贝叶斯理论的垃圾邮件过滤,基于支持向量机的垃圾邮件过滤.基于决策树的垃圾邮件过滤.基于数据挖掘的垃圾邮件过滤。分析各项技术的优劣。  相似文献   

15.
基于聚类的垃圾邮件识别技术研究   总被引:1,自引:0,他引:1  
随着垃圾邮件数量日益攀升,如何有效识别垃圾邮件已成为一项非常重要的课题。为克服k最近邻(k-nea-rest neighbor,kNN)分类法在垃圾邮件识别中的缺陷,本文基于聚类算法提出了一种改进kNN识别方法。首先使用基于最小距离原则的一趟聚类算法将训练邮件集合划分为大小几乎相同的超球体,每个超球体包含一个类别或多个类别的文本;其次,采用投票机制对得到的聚类结果进行簇标识,即以簇中最多文本的类别作为簇的类别,得到的识别模型由具有标识的簇组成;最后,结合最近邻分类思想,对输入的邮件进行自动识别。实验结果表明,该方法可大幅度地降低邮件相似度的计算量,较TiMBL、Nave Bayesian、Stacking等算法效果要好。同时,该方法是一种可增量式更新识别模型的方法,具有一定的实用性。  相似文献   

16.
针对传统极坐标变换在频域配准中的问题,提出了一种基于改进极坐标的频域配准算法。先对参考图像和待配准图像分别进行傅立叶变换,将频谱信息映射至改进极坐标下。依次沿角度和极径方向投影,计算出图像间的旋转、缩放参数;再对待配准图像进行相应地旋转、缩放校正,根据幅度加权的相位差进一步得到图像间的平移量。当耗费的计算量大致相当时,与基于传统极坐标或伪极坐标变换的频域配准算法相比较,文中算法获得更高的图像配准精度。  相似文献   

17.
目的研究三维图像边缘检测中边缘的定位精度问题,根据多尺度小波变换的方法,提出一种自适应阈值三维图像多尺度边缘检测技术。方法首先对三维医学图像分解成多幅二维图像,再对图像直方图滤波平滑处理,消除噪声的影响,然后对平滑后的直方图进行多尺度分析,找出直方图的谷点,以不同尺度下的谷点比较后自动确定精确阈值,按照阈值对图像分割,然后对分割图像进行边缘检测,最后将多幅二维图像合成三维图像。结果实验表明,该方法能够自动准确选择分割阈值,准确检测三维图像的边缘。结论算法能解决人工估算阈值不够准确的问题,所检测到的三维图像的边缘能够满足目标识别和三维重建的要求。  相似文献   

18.
针对在压缩传感中独立使用全局或局部稀疏字典所分别导致的图像细节或整体图像结构信息的丢失,提出了一种联合利用局部和全局稀疏约束来捕捉磁共振图像细节和整体结构信息的磁共振图像重建算法。该算法首先从特定的磁共振图像中训练出稀疏字典,然后利用该字典进行局部稀疏编码。其次,利用预定义的全局字典来加强磁共振图像的全局稀疏性。最后,在局部和全局稀疏的共同约束下,利用非线性共轭梯度算法来对重建模型进行求解。整个重建过程可以重复迭代以逐步改善重建质量。实验结果表明:当下采样因子达到10时,相比于字典学习算法(dictionary learning MRI,DLMRI),提出的算法在重建质量上可以提高1-6dB。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号