共查询到18条相似文献,搜索用时 46 毫秒
1.
基于改进贝叶斯的垃圾邮件过滤算法综述 总被引:4,自引:0,他引:4
朴素贝叶斯分类器是机器学习中一种简单而又有效的分类方法,但是由于它的属性条件独立性假设在实际应用中经常不成立,这影响了它的分类性能,为此基于改进贝叶斯的垃圾邮件过滤算法已受到越来越多的研究人员关注.本文通过对当前提出的最新的具有代表性的基于改进贝叶斯的垃圾邮件过滤算法进行分析和比较,总结各个算法的优点和不足,从而便于研究者对已有的算法再进行改进,提出具有更好性能的新的邮件过滤算法,同时方便使用者在应用时对算法的选择和使用. 相似文献
2.
垃圾邮件的改进贝叶斯过滤算法 总被引:1,自引:0,他引:1
在研究贝叶斯过滤算法原理和实现方法的基础上,将垃圾邮件的先验概率由常数改进为实际概率,改进了token的选取范围和选取规则,在检测内容上增加url和图片。最后设计了一个基于改进贝叶斯过滤算法的垃圾邮件过滤器。实验结果表明,这种改进的贝叶斯过滤算法在垃圾邮件过滤中有良好的应用效果。 相似文献
3.
基于贝叶斯理论的垃圾邮件算法研究 总被引:1,自引:0,他引:1
为减少垃圾邮件在服务器端的出现,以贝叶斯理论为基础,探讨了可在邮件服务器端实现过滤和自我升级的系统;以合法和非法两类邮件的分析为基础,采用贝叶斯模型生成过滤器,用真实邮件进行仿真操作,验证了模型的可行性。 相似文献
4.
5.
系统以垃圾邮件过滤为目标,设计并实现了一个垃圾邮件过滤系统SpamBlocker.该系统整合规则过滤、贝叶斯分类、病毒检测和黑/白名单等垃圾邮件检测技术,采用评分方法判断邮件的垃圾性,并利用规则过滤给贝叶斯分类提供学习样本,提高了系统对新垃圾邮件的适应性. 相似文献
6.
随着电子邮件在日常生活中多方面的灵活应用,大批量垃圾邮件的产生在很大程度上干扰了用户对电子邮件的使用.针对垃圾邮件过滤的研究现状,在阐述目前垃圾邮件过滤研究成果基础上,重点描述了具备高性能、低误判率的贝叶斯算法,并以贝叶斯算法、反馈学习技术为原理,利用Microsoft Visual C++6.0实现了垃圾邮件过滤系统. 相似文献
7.
随着internet的快速发展,垃圾邮件泛滥成灾.面对垃圾邮件日益严重的现状,提出了贝叶斯邮件过滤模型并讨论了贝叶斯分类方法在垃圾邮件过滤中的应用.针对难以获得大量有类别标签的邮件训练集问题,利用贝叶斯具有增量学习特征,分析并提出了基于小规模训练集的贝叶斯增量邮件过滤方法,通过最小化当前邮件分类器的分类损失,来选择有利于提高分类器性能的邮件加入训练集.实验结果表明,该方法是切实可行的并具有良好的效果. 相似文献
8.
一种基于主动贝叶斯分类技术的垃圾邮件过滤方法 总被引:1,自引:0,他引:1
目前,将机器学习、文本分类与信息过滤技术相结合的过滤方法成为研究热点.对实际邮件过滤时往往会遇到训练样本中包含大量未带类别标注的邮件,应用传统分类方法存在耗时且过滤性能差等问题,文章提出采用主动贝叶斯分类方法RANB对训练样本进行预处理,以标识其多类别;实验表明,这种方法可有效地提高训练样本质量,提高过滤器性能,在各项评价指标上具备优越性. 相似文献
9.
本文针对朴素贝叶斯垃圾邮件过滤算法对垃圾邮件的误判,提出了一种新的改进型的贝叶斯邮件过滤算法,即引入了影响决策结果的损失因子λ,保证了在损失风险最小的前提下进行邮件的判断,使误判率降低,提高了过滤器的分类效果。 相似文献
10.
闫斐 《太原师范学院学报(自然科学版)》2010,9(2):63-67
垃圾邮件过滤技术主要有三个大类,它们分别运用不同的方法和途径来判定垃圾邮件:基于IP地址;基于规则;基于邮件内容.基于内容的垃圾邮件过滤是一种常用的反垃圾邮件技术,它以邮件在内容方面的特点来鉴别邮件,在技术上利用文本分类的方法来实现.文章设计了基于内容的,采用贝叶斯方法进行文本分类的垃圾邮件处理系统. 相似文献
11.
垃圾邮件制造者为了躲避基于文本的垃圾邮件过滤器的过滤,常常将文字嵌入到图像中,产生了大量的广告垃圾图像.为解决这一问题,提出了基于图像内容的垃圾图像过滤方法.首先提取出图像中的文字区域,再利用广告垃圾图像中的文字区域特征进行广告垃圾图像过滤.实验结果表明利用文字区域特征过滤广告垃圾图像是行之有效的. 相似文献
12.
垃圾邮件过滤中特征选择方法研究 总被引:2,自引:0,他引:2
文章对垃圾邮件过滤中的特征选择问题进行了研究,引入"词共现模型"考虑词语之间的语义联系信息,和传统的信息增益特征选择方法结合表示邮件,采用神经网络方法对邮件进行分类得到垃圾邮件过滤器.实验表明,文章提出的将词共现对和信息增益结合的特征选择方法能够提高垃圾邮件过滤的精确度. 相似文献
13.
日益泛滥的图像垃圾邮件给互联网用户带来极大的不便,如何对其实施有效过滤成为亟待解决的问题.分析图像垃圾邮件过滤中的关键问题邮件图像的特征提取.利用垃圾邮件重复发送、内容高度相似的特点,提出一种过滤图像垃圾邮件的新方法:提取邮件图像的综合特征值,以此作为目标邮件图像与垃圾邮件图像样本库相似性度量的依据,通过检测其是否相似来实现垃圾邮件图像的过滤.实验中,提取邮件图像的颜色、纹理和形状3种底层特征,其描述方法分别为颜色矩、共生矩阵统计量和不变矩.结果表明该方法对图像垃圾邮件的召回率达到95%以上. 相似文献
14.
垃圾邮件的概念漂移及过滤技术研究 总被引:1,自引:0,他引:1
提出了双级别的概念漂移检测算法,监视已有的垃圾邮件过滤模型在对邮件分类时是否产生了持续的分类错误,进而对概念漂移进行识别。针对由用户偏好引起的垃圾邮件概念范畴变化,基于本体提出邮件数字指纹与概念子类别之间的关联强度和隶属度算法。通过对比实验,验证了所提方法在垃圾邮件概念漂移问题上的有效性。 相似文献
15.
林伟 《陕西理工学院学报(自然科学版)》2012,28(4):36-40
电子邮件的普及给人们的生活带来极大的方便,但目前垃圾邮件的泛滥严重影响了用户的正常使用。贝叶斯算法因简单在英文邮件过滤中取得了良好的过滤效果,分析了贝叶斯算法的原理及其在垃圾邮件过滤中的应用,给出垃圾邮件过滤的整个过滤流程,设计并实现了一种语言无关的垃圾邮件过滤系统。 相似文献
16.
孔颖 《浙江科技学院学报》2010,22(6)
介绍基于HTML标签的卡方分布算法在垃圾邮件过滤中的应用。首先对通过浏览器收集到的邮件进行分析,将其转换为HTML源代码的形式,再根据HTML语言的特点对其进行特征提取,从而达到邮件预处理的目的。随后采用LVQ神经网络建立分类器模型,以达到最终分离正常邮件(ham)和垃圾邮件(spam)的目的。对比实验表明,结合HTML代码的卡方分布特征提取和LVQ神经网络的分类器模型效果更好。 相似文献
17.
从垃圾邮件的显著特性出发 ,提出了一种基于预处理的多代理的智能邮件过滤系统的设计方案 .在提高系统处理时间和有效降低邮件误判率等性能方面有所改善 ,有较好的实际应用价值 相似文献
18.
针对传统的垃圾邮件过滤方法不能有效阻止出现的新型垃圾邮件的问题,借鉴生物免疫系统中疫苗的概念和免疫记忆功能,提出了一种基于疫苗机制的垃圾邮件过滤模型SFM-V(spam filtering model based on vaccine mechanism).该模型详细描述了垃圾邮件检测器的演化和抗原提呈的过程,通过疫苗控制器实现疫苗提取和疫苗接种,新生成的免疫记忆细胞作为疫苗实现信息交互,共享抗体.并引入小生境免疫记忆与共享机制,增加检测器的多样性及稳定性,促进免疫记忆库及原始抗体库中优良个体的保存,有效地提取和记忆垃圾邮件的未知特征和变异特征.利用CCERT(china education and research network)的邮件样本集对该模型进行训练和检测,仿真实验结果表明该模型有效地提高了垃圾邮件的正确率、召回率等特性,降低了垃圾邮件的虚报率. 相似文献