首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
基于改进贝叶斯的垃圾邮件过滤算法综述   总被引:4,自引:0,他引:4  
朴素贝叶斯分类器是机器学习中一种简单而又有效的分类方法,但是由于它的属性条件独立性假设在实际应用中经常不成立,这影响了它的分类性能,为此基于改进贝叶斯的垃圾邮件过滤算法已受到越来越多的研究人员关注.本文通过对当前提出的最新的具有代表性的基于改进贝叶斯的垃圾邮件过滤算法进行分析和比较,总结各个算法的优点和不足,从而便于研究者对已有的算法再进行改进,提出具有更好性能的新的邮件过滤算法,同时方便使用者在应用时对算法的选择和使用.  相似文献   

2.
垃圾邮件的改进贝叶斯过滤算法   总被引:1,自引:0,他引:1  
在研究贝叶斯过滤算法原理和实现方法的基础上,将垃圾邮件的先验概率由常数改进为实际概率,改进了token的选取范围和选取规则,在检测内容上增加url和图片。最后设计了一个基于改进贝叶斯过滤算法的垃圾邮件过滤器。实验结果表明,这种改进的贝叶斯过滤算法在垃圾邮件过滤中有良好的应用效果。  相似文献   

3.
基于贝叶斯理论的垃圾邮件算法研究   总被引:1,自引:0,他引:1  
为减少垃圾邮件在服务器端的出现,以贝叶斯理论为基础,探讨了可在邮件服务器端实现过滤和自我升级的系统;以合法和非法两类邮件的分析为基础,采用贝叶斯模型生成过滤器,用真实邮件进行仿真操作,验证了模型的可行性。  相似文献   

4.
大量的垃圾邮件的出现给用户收发电子邮件带来了极大的困扰,目前基于贝叶斯算法的垃圾邮件过滤系统在处理垃圾邮件上取得了很好的效果,但该算法也存在一些缺陷,本文从分析贝叶斯算法入手,提出了对该算法的一些改进方案,最后对贝叶斯算法进行了总结和展望。  相似文献   

5.
系统以垃圾邮件过滤为目标,设计并实现了一个垃圾邮件过滤系统SpamBlocker.该系统整合规则过滤、贝叶斯分类、病毒检测和黑/白名单等垃圾邮件检测技术,采用评分方法判断邮件的垃圾性,并利用规则过滤给贝叶斯分类提供学习样本,提高了系统对新垃圾邮件的适应性.  相似文献   

6.
随着电子邮件在日常生活中多方面的灵活应用,大批量垃圾邮件的产生在很大程度上干扰了用户对电子邮件的使用.针对垃圾邮件过滤的研究现状,在阐述目前垃圾邮件过滤研究成果基础上,重点描述了具备高性能、低误判率的贝叶斯算法,并以贝叶斯算法、反馈学习技术为原理,利用Microsoft Visual C++6.0实现了垃圾邮件过滤系统.  相似文献   

7.
随着internet的快速发展,垃圾邮件泛滥成灾.面对垃圾邮件日益严重的现状,提出了贝叶斯邮件过滤模型并讨论了贝叶斯分类方法在垃圾邮件过滤中的应用.针对难以获得大量有类别标签的邮件训练集问题,利用贝叶斯具有增量学习特征,分析并提出了基于小规模训练集的贝叶斯增量邮件过滤方法,通过最小化当前邮件分类器的分类损失,来选择有利于提高分类器性能的邮件加入训练集.实验结果表明,该方法是切实可行的并具有良好的效果.  相似文献   

8.
高洁 《科技信息》2011,(32):254-254
本文针对朴素贝叶斯垃圾邮件过滤算法对垃圾邮件的误判,提出了一种新的改进型的贝叶斯邮件过滤算法,即引入了影响决策结果的损失因子λ,保证了在损失风险最小的前提下进行邮件的判断,使误判率降低,提高了过滤器的分类效果。  相似文献   

9.
一种基于主动贝叶斯分类技术的垃圾邮件过滤方法   总被引:1,自引:0,他引:1  
目前,将机器学习、文本分类与信息过滤技术相结合的过滤方法成为研究热点.对实际邮件过滤时往往会遇到训练样本中包含大量未带类别标注的邮件,应用传统分类方法存在耗时且过滤性能差等问题,文章提出采用主动贝叶斯分类方法RANB对训练样本进行预处理,以标识其多类别;实验表明,这种方法可有效地提高训练样本质量,提高过滤器性能,在各项评价指标上具备优越性.  相似文献   

10.
垃圾邮件过滤技术主要有三个大类,它们分别运用不同的方法和途径来判定垃圾邮件:基于IP地址;基于规则;基于邮件内容.基于内容的垃圾邮件过滤是一种常用的反垃圾邮件技术,它以邮件在内容方面的特点来鉴别邮件,在技术上利用文本分类的方法来实现.文章设计了基于内容的,采用贝叶斯方法进行文本分类的垃圾邮件处理系统.  相似文献   

11.
垃圾邮件制造者为了躲避基于文本的垃圾邮件过滤器的过滤,常常将文字嵌入到图像中,产生了大量的广告垃圾图像.为解决这一问题,提出了基于图像内容的垃圾图像过滤方法.首先提取出图像中的文字区域,再利用广告垃圾图像中的文字区域特征进行广告垃圾图像过滤.实验结果表明利用文字区域特征过滤广告垃圾图像是行之有效的.  相似文献   

12.
垃圾邮件过滤中特征选择方法研究   总被引:2,自引:0,他引:2  
文章对垃圾邮件过滤中的特征选择问题进行了研究,引入"词共现模型"考虑词语之间的语义联系信息,和传统的信息增益特征选择方法结合表示邮件,采用神经网络方法对邮件进行分类得到垃圾邮件过滤器.实验表明,文章提出的将词共现对和信息增益结合的特征选择方法能够提高垃圾邮件过滤的精确度.  相似文献   

13.
日益泛滥的图像垃圾邮件给互联网用户带来极大的不便,如何对其实施有效过滤成为亟待解决的问题.分析图像垃圾邮件过滤中的关键问题邮件图像的特征提取.利用垃圾邮件重复发送、内容高度相似的特点,提出一种过滤图像垃圾邮件的新方法:提取邮件图像的综合特征值,以此作为目标邮件图像与垃圾邮件图像样本库相似性度量的依据,通过检测其是否相似来实现垃圾邮件图像的过滤.实验中,提取邮件图像的颜色、纹理和形状3种底层特征,其描述方法分别为颜色矩、共生矩阵统计量和不变矩.结果表明该方法对图像垃圾邮件的召回率达到95%以上.  相似文献   

14.
垃圾邮件的概念漂移及过滤技术研究   总被引:1,自引:0,他引:1  
提出了双级别的概念漂移检测算法,监视已有的垃圾邮件过滤模型在对邮件分类时是否产生了持续的分类错误,进而对概念漂移进行识别。针对由用户偏好引起的垃圾邮件概念范畴变化,基于本体提出邮件数字指纹与概念子类别之间的关联强度和隶属度算法。通过对比实验,验证了所提方法在垃圾邮件概念漂移问题上的有效性。  相似文献   

15.
电子邮件的普及给人们的生活带来极大的方便,但目前垃圾邮件的泛滥严重影响了用户的正常使用。贝叶斯算法因简单在英文邮件过滤中取得了良好的过滤效果,分析了贝叶斯算法的原理及其在垃圾邮件过滤中的应用,给出垃圾邮件过滤的整个过滤流程,设计并实现了一种语言无关的垃圾邮件过滤系统。  相似文献   

16.
介绍基于HTML标签的卡方分布算法在垃圾邮件过滤中的应用。首先对通过浏览器收集到的邮件进行分析,将其转换为HTML源代码的形式,再根据HTML语言的特点对其进行特征提取,从而达到邮件预处理的目的。随后采用LVQ神经网络建立分类器模型,以达到最终分离正常邮件(ham)和垃圾邮件(spam)的目的。对比实验表明,结合HTML代码的卡方分布特征提取和LVQ神经网络的分类器模型效果更好。  相似文献   

17.
从垃圾邮件的显著特性出发 ,提出了一种基于预处理的多代理的智能邮件过滤系统的设计方案 .在提高系统处理时间和有效降低邮件误判率等性能方面有所改善 ,有较好的实际应用价值  相似文献   

18.
针对现有贝叶斯算法应用于垃圾邮件过滤时,贝叶斯贝努利模型对邮件文本特征向量进行处理不能区分特征向量的重要性,导致邮件分类召回率低,同时还存在合法邮件被误判的风险的问题,采用贝叶斯多项式模型对特征向量进行加权处理来区分特征向量的重要性;然后,采用低风险策略来降低合法邮件被误判的风险,提出基于多项式模型和低风险的贝叶斯垃圾邮件过滤算法.实验结果表明:对于不同数量的特征项,该算法能够有效提高邮件分类的正确率与召回率,降低合法邮件被误判的风险,并在过滤文本字符数量较大的邮件时,具有性能平稳、波动小的特点.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号