首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 93 毫秒
1.
基于贝叶斯理论的垃圾邮件算法研究   总被引:1,自引:0,他引:1  
为减少垃圾邮件在服务器端的出现,以贝叶斯理论为基础,探讨了可在邮件服务器端实现过滤和自我升级的系统;以合法和非法两类邮件的分析为基础,采用贝叶斯模型生成过滤器,用真实邮件进行仿真操作,验证了模型的可行性。  相似文献   

2.
大量的垃圾邮件的出现给用户收发电子邮件带来了极大的困扰,目前基于贝叶斯算法的垃圾邮件过滤系统在处理垃圾邮件上取得了很好的效果,但该算法也存在一些缺陷,本文从分析贝叶斯算法入手,提出了对该算法的一些改进方案,最后对贝叶斯算法进行了总结和展望。  相似文献   

3.
基于改进贝叶斯的垃圾邮件过滤算法综述   总被引:4,自引:0,他引:4  
朴素贝叶斯分类器是机器学习中一种简单而又有效的分类方法,但是由于它的属性条件独立性假设在实际应用中经常不成立,这影响了它的分类性能,为此基于改进贝叶斯的垃圾邮件过滤算法已受到越来越多的研究人员关注.本文通过对当前提出的最新的具有代表性的基于改进贝叶斯的垃圾邮件过滤算法进行分析和比较,总结各个算法的优点和不足,从而便于研究者对已有的算法再进行改进,提出具有更好性能的新的邮件过滤算法,同时方便使用者在应用时对算法的选择和使用.  相似文献   

4.
介绍了采用贝叶斯统计法过滤垃圾邮件的算法,通过简单贝叶斯过滤算法的研究,引入了派生的贝叶斯过滤算法——零散二元多项式散列法过滤技术,它能够处理单个的特征词和变异的特征词汇.零散二元多项式散列法和贝叶斯统计法的整合,可以建立一个功能强大的垃圾邮件过滤器.  相似文献   

5.
目前电子邮件得到了广泛的应用,同时垃圾邮件问题也随之而来.本文针对垃圾邮件的处理,从用户的兴趣角度出发,基于朴素贝叶斯算法对垃圾邮件个性化过滤.在朴素贝叶斯算法的条件概率计算中,本文选用了多变量贝努里事件模型的计算方法,最后以VC++6.0为实验平台在Ling-Spam语料库上进行实验.  相似文献   

6.
垃圾邮件的改进贝叶斯过滤算法   总被引:1,自引:0,他引:1  
在研究贝叶斯过滤算法原理和实现方法的基础上,将垃圾邮件的先验概率由常数改进为实际概率,改进了token的选取范围和选取规则,在检测内容上增加url和图片。最后设计了一个基于改进贝叶斯过滤算法的垃圾邮件过滤器。实验结果表明,这种改进的贝叶斯过滤算法在垃圾邮件过滤中有良好的应用效果。  相似文献   

7.
高洁 《科技信息》2011,(32):254-254
本文针对朴素贝叶斯垃圾邮件过滤算法对垃圾邮件的误判,提出了一种新的改进型的贝叶斯邮件过滤算法,即引入了影响决策结果的损失因子λ,保证了在损失风险最小的前提下进行邮件的判断,使误判率降低,提高了过滤器的分类效果。  相似文献   

8.
基于贝叶斯算法的垃圾邮件过滤技术的研究与改进   总被引:5,自引:0,他引:5  
随着电子邮件的应用与普及,垃圾邮件的泛滥也越来越多地受到人们的关注.本文对基于贝叶斯的垃圾邮件过滤器的原理及其关键技术进行了详细的描述.针对朴素贝叶斯模型对分类信息过度简化和准确率低等缺点,通过引入分级的最小风险算法和对多项式和多重贝努利估计模犁进行混合的方法分别对贝叶斯过滤器进行了改进,并进行了实验.实验结果表明,改进后的贝叶斯过滤器具有了更好过滤效果.  相似文献   

9.
多Agent系统模型表示是系统实现推理、学习、自组织和Agent间通信的基础。由于多Agent系统结点较多的特性, 一般用单个贝叶斯网络作为模型表示是不现实的。本文提出用多分片的贝叶斯网络作为多Agent系统的表示语言,并详细讨论了将多分片贝叶斯网络转化为具有良好推理计算特性的联合树扩展形式的连接联合森林的具体过程。  相似文献   

10.
一种基于主动贝叶斯分类技术的垃圾邮件过滤方法   总被引:1,自引:0,他引:1  
目前,将机器学习、文本分类与信息过滤技术相结合的过滤方法成为研究热点.对实际邮件过滤时往往会遇到训练样本中包含大量未带类别标注的邮件,应用传统分类方法存在耗时且过滤性能差等问题,文章提出采用主动贝叶斯分类方法RANB对训练样本进行预处理,以标识其多类别;实验表明,这种方法可有效地提高训练样本质量,提高过滤器性能,在各项评价指标上具备优越性.  相似文献   

11.
垃圾邮件数量庞大、伪装形式多种多样,给反垃圾邮件带来了巨大的挑战。提出了一个基于行为和时间特征的垃圾邮件检测方法。根据邮件收发记录分析基于社会网络的行为特征和基于邮件发送间隔的时间特征,采用步进式判别分析方法,选择具有较强判别能力的行为特征,形成特征子空间,将训练样本投影到特征子空间。使用带标签的训练样本训练支持向量机SVM,形成邮件决策信息,以此检测出垃圾邮件。利用最近3年真实邮件数据,从不同的角度进行了对比实验。结果证明,提出的行为与时间特征能有效提升垃圾邮件检测的准确率和查全率,其整体性能优于其他的基于行为的垃圾邮件检测方法。  相似文献   

12.
由于缺乏标准的中文邮件样本集,无法评测不同垃圾邮件过滤系统的性能.通过 分析邮件样本收集过程中存在的各种问题,研究了生成标准样本涉及的问题,设计了一个基于真实环境的标准邮件样本生成系统结构,并希望以此推出一个用于衡量邮件过滤系统性能的标准的邮件样本集,最终作为邮件过滤技术研究的基本语料.  相似文献   

13.
利用改进的支持向量机进行垃圾邮件识别,先对样本进行SVD降维,再结合有标记与无标记样本进行直推式支持向量机训练,实验证明获得的分类器具有较好识别效果.  相似文献   

14.
电子邮件的普及给人们的生活带来极大的方便,但目前垃圾邮件的泛滥严重影响了用户的正常使用。贝叶斯算法因简单在英文邮件过滤中取得了良好的过滤效果,分析了贝叶斯算法的原理及其在垃圾邮件过滤中的应用,给出垃圾邮件过滤的整个过滤流程,设计并实现了一种语言无关的垃圾邮件过滤系统。  相似文献   

15.
图像中的文本区域为判别图像垃圾邮件提供了重要依据.为了获得图像中的文本区域信息,提出了基于Hough变换提取图像中倾斜文本区域的算法和降低图像背景干扰的八邻域细小边缘去除算法,实现了一种不受图像中文本颜色、字体、大小、位置、方向限制的文本区域的自动提取方法.在包含100幅垃圾图像的数据集上进行提取图像文本区域的实验.实验结果显示,新方法具有良好的文本区域提取性能.  相似文献   

16.
针对传统的垃圾邮件过滤方法不能有效阻止出现的新型垃圾邮件的问题,借鉴生物免疫系统中疫苗的概念和免疫记忆功能,提出了一种基于疫苗机制的垃圾邮件过滤模型SFM-V(spam filtering model based on vaccine mechanism).该模型详细描述了垃圾邮件检测器的演化和抗原提呈的过程,通过疫苗控制器实现疫苗提取和疫苗接种,新生成的免疫记忆细胞作为疫苗实现信息交互,共享抗体.并引入小生境免疫记忆与共享机制,增加检测器的多样性及稳定性,促进免疫记忆库及原始抗体库中优良个体的保存,有效地提取和记忆垃圾邮件的未知特征和变异特征.利用CCERT(china education and research network)的邮件样本集对该模型进行训练和检测,仿真实验结果表明该模型有效地提高了垃圾邮件的正确率、召回率等特性,降低了垃圾邮件的虚报率.  相似文献   

17.
介绍基于HTML标签的卡方分布算法在垃圾邮件过滤中的应用。首先对通过浏览器收集到的邮件进行分析,将其转换为HTML源代码的形式,再根据HTML语言的特点对其进行特征提取,从而达到邮件预处理的目的。随后采用LVQ神经网络建立分类器模型,以达到最终分离正常邮件(ham)和垃圾邮件(spam)的目的。对比实验表明,结合HTML代码的卡方分布特征提取和LVQ神经网络的分类器模型效果更好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号