首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 389 毫秒
1.
针对现有贝叶斯算法应用于垃圾邮件过滤时,贝叶斯贝努利模型对邮件文本特征向量进行处理不能区分特征向量的重要性,导致邮件分类召回率低,同时还存在合法邮件被误判的风险的问题,采用贝叶斯多项式模型对特征向量进行加权处理来区分特征向量的重要性;然后,采用低风险策略来降低合法邮件被误判的风险,提出基于多项式模型和低风险的贝叶斯垃圾邮件过滤算法.实验结果表明:对于不同数量的特征项,该算法能够有效提高邮件分类的正确率与召回率,降低合法邮件被误判的风险,并在过滤文本字符数量较大的邮件时,具有性能平稳、波动小的特点.  相似文献   

2.
基于概率的朴素贝叶斯分类器因其算法复杂度低、分类精度高而被广泛应用于垃圾邮件过滤领域。该文在对传统朴素贝叶斯分类器进行分析的同时,结合垃圾邮件过滤的特性,设计并实现了基于多项式朴素贝叶斯算法的垃圾邮件过滤器。该过滤器引入拉普拉斯平滑因子降低合法邮件被误判为垃圾邮件的概率,得到了较好的分类效果。实验结果验证了方法的有效性。  相似文献   

3.
基于贝叶斯概率模型的邮件过滤算法探讨   总被引:1,自引:0,他引:1  
讨论了邮件过滤模块,通过分析研究该模块中垃圾邮件关键词的统计概率分布,提出了基于贝叶斯概率模型的邮件过滤算法,并对该算法的合理性和复杂度进行了分析。可以根据垃圾邮件内容的特征,建立贝叶斯概率模型,计算出一封邮件是垃圾邮件的概率,从而判断其是否为垃圾邮件。  相似文献   

4.
基于贝叶斯概率模型的邮件过滤算法探讨   总被引:6,自引:0,他引:6  
讨论了邮件过滤模块,通过分析研究该模块中垃圾邮件关键词的统计概率分布,提出了基于贝叶斯概率模型的邮件过滤算法,并对该算法的合理性和复杂度进行了分析.可以根据垃圾邮件内容的特征,建立贝叶斯概率模型,计算出一封邮件是垃圾邮件的概率,从而判断其是否为垃圾邮件.  相似文献   

5.
随着internet的快速发展,垃圾邮件泛滥成灾.面对垃圾邮件日益严重的现状,提出了贝叶斯邮件过滤模型并讨论了贝叶斯分类方法在垃圾邮件过滤中的应用.针对难以获得大量有类别标签的邮件训练集问题,利用贝叶斯具有增量学习特征,分析并提出了基于小规模训练集的贝叶斯增量邮件过滤方法,通过最小化当前邮件分类器的分类损失,来选择有利于提高分类器性能的邮件加入训练集.实验结果表明,该方法是切实可行的并具有良好的效果.  相似文献   

6.
电子邮件作为网络应用的一个重要方面已成为现代通信中不可缺少的一部分,但是垃圾邮件的蔓延给用户带来了严重的损失,如何防范垃圾邮件具有重要的实用意义.在分析了垃圾邮件特点的基础上,构建贝叶斯分类模型,利用贝叶斯分类模型设计了一种邮件过滤系统.实验结果表明,设计的邮件过滤系统对垃圾邮件的过滤具有比较明显的效果.  相似文献   

7.
骆丽娟 《科技信息》2007,(28):324-328
基于内容的垃圾邮件过滤方法是垃圾邮件过滤方法的一个重要分支,由于其高准确率,朴素贝叶斯算法更在基于内容的过滤方法中占了一席之地。本文介绍了贝叶斯算法的基本原理及其在邮件过滤中的应用,并写出了其监督训练过程和邮件过滤具体过程,做出了全部过程的进程图。提出了笔者自己的一点想法,建立用户个人邮件训练集可能会更一步增加垃圾邮件过滤的正确度与召回率。  相似文献   

8.
电子邮件的普及给人们的生活带来极大的方便,但目前垃圾邮件的泛滥严重影响了用户的正常使用。贝叶斯算法因简单在英文邮件过滤中取得了良好的过滤效果,分析了贝叶斯算法的原理及其在垃圾邮件过滤中的应用,给出垃圾邮件过滤的整个过滤流程,设计并实现了一种语言无关的垃圾邮件过滤系统。  相似文献   

9.
随着电子邮件在日常生活中多方面的灵活应用,大批量垃圾邮件的产生在很大程度上干扰了用户对电子邮件的使用.针对垃圾邮件过滤的研究现状,在阐述目前垃圾邮件过滤研究成果基础上,重点描述了具备高性能、低误判率的贝叶斯算法,并以贝叶斯算法、反馈学习技术为原理,利用Microsoft Visual C++6.0实现了垃圾邮件过滤系统.  相似文献   

10.
阐述了贝叶斯算法的基本原理及基于朴素贝叶斯算法的反垃圾邮件自动过滤技术.在深刻分析朴素贝叶斯算法不足的基础上,提出了旨在提高垃圾邮件过滤精确率的改进方案,给出了实验结果.  相似文献   

11.
基于内容的垃圾邮件过滤本质上是文本分类问题,支持向量机分类器非常适合于垃圾邮件过滤这一二分类问题,但标准的支持向量机是基于分类精度进行优化的,对两类邮件的重要性未以区别,造成了邮件分类时虽然整体精度较高,但对正常邮件的误判率也较高.据此笔者提出了一种基于加权支持向量机的垃圾邮件过滤算法,通过增加两类邮件的类别权重及反映每封邮件重要性的权重,对支持向量机分类器进行训练,在保证分类精度的同时,尽可能地降低对正常邮件的误判率.实验表明该算法取得了很好的过滤效果.  相似文献   

12.
基于源地址约束的垃圾邮件过滤模型   总被引:2,自引:0,他引:2  
提出了一种基于关联规则的垃圾邮件挖掘算法,通过计算邮件源地址和邮件关键词的支持度来定位垃圾邮件源地址.该算法在Apriori算法基础上进行了改进,增加了邮件源地址和关键词约束,与基于关键词过滤算法相比提高了准确率,与基于语义分析的过滤算法相比降低了算法复杂度.实验结果表明,该算法的误判率在邮件数量增加到350封时会减小到4%,其过滤速度也会随着邮件的增加而提高。  相似文献   

13.
由于垃圾邮件类型的不断变化,超出现有过滤算法模型中所采用的训练样本范围,造成过滤性能不断下降。因此,提出了一种基于知识积累方法的垃圾邮件过滤算法。利用KNN方法的惰性学习机制,将新型的垃圾邮件动态加入训练样本集中,以实现知识的不断积累过程。在此基础上,应用KNN方法对未知邮件样本进行精确匹配,以排除合法邮件的误判结果。实验表明算法具有较好的过滤性能。  相似文献   

14.
为解决垃圾邮件过滤的精确度和有效性问题,提出了一种基于邮件内容过滤的垃圾邮件过滤方法,该方法采用Boosting算法构造了一种垃圾邮件过滤器,利用该垃圾邮件过滤器实现对垃圾邮件的过滤. 本文借鉴文本分类和信息检索领域所使用的评价指标,构建了垃圾邮件过滤器的评价体系,利用该评价体系,针对基于Boosting算法所构造的垃圾邮件过滤器对垃圾邮件的过滤实验所得到的数据进行了测试和评估,测试和评估的结果验证了Boosting算法在垃圾邮件过滤中的有效性,其性能优于传统的贝叶斯算法.   相似文献   

15.
考虑到反垃圾邮件本身特点,借鉴文本分类中的已有技术,将其应用到垃圾邮件的屏蔽中来.因为将合法邮件判别为垃圾邮件对于邮件用户造成的损失明显大于相反的操作,所以定义了一个损失函数,将其与朴素贝叶斯算法结合,实现了基于最小损失的垃圾邮件屏蔽算法.在一个公认的垃圾数据集上的实验结果验证了引入损失函数的有效性.  相似文献   

16.
文章首先给出了垃圾邮件的定义,在分析比较国内外反垃圾邮件关键技术的基础上,提出了具有在广域网范围内进行垃圾邮件过滤的综合管理系统的设计方案,重点讨论了过滤引擎的选取和基于内容的贝叶斯过滤算法的实现。  相似文献   

17.
为了提高电子邮件中垃圾邮件的过滤准确率和效率,以朴素贝叶斯算法和K最近邻(KNN:K-Nearest Neighbors)算法为基础,对传统垃圾邮件过滤算法进行改进,给出邮件的合法属性和非法属性的概念,并提出一种新的分类算法--基于邮件合法属性和非法属性的分类算法(SEASF:Simple and Efficient Algorithm to Spam Filter based on legitimate attribute and nonlicet attribute)。SEASF计算复杂度较低,可适用于大规模场合及邮件的在线过滤。将SEASF算法应用于垃圾邮件过滤的结果表明,该算法可大幅度提高分类精度,分类速度也令人满意。  相似文献   

18.
为解决在网络应用中垃圾邮件占用大量网络资源,并威胁邮件系安全的问题,根据垃圾邮件体的特点,在对大量垃圾邮件进行统计分析的基础上,依据贝叶斯理论,研究了垃圾邮件关键词统计概率的分布规律,并提出了在Solaris系统平台上使用SMTP协议服务器端垃圾邮件的过滤算法.LAN仿真测试结果表明,贝叶斯垃圾邮件概率公式的应用提高了垃圾邮件命中率.  相似文献   

19.
分析了E-mail邮件协议和邮件格式特征,设计与实现了一种客户端垃圾邮件过滤系统.系统采用黑白名单过滤、邮件特征过滤和贝叶斯分类相结合的三层过滤技术,并通过用户反馈机制降低误报率.实验结果显示,系统可满足用户对邮件的个性需求,提高了对垃圾邮件过滤的准确性.  相似文献   

20.
系统以垃圾邮件过滤为目标,设计并实现了一个垃圾邮件过滤系统SpamBlocker.该系统整合规则过滤、贝叶斯分类、病毒检测和黑/白名单等垃圾邮件检测技术,采用评分方法判断邮件的垃圾性,并利用规则过滤给贝叶斯分类提供学习样本,提高了系统对新垃圾邮件的适应性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号