首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 64 毫秒
1.
基于内容的垃圾邮件过滤本质上是文本分类问题,支持向量机分类器非常适合于垃圾邮件过滤这一二分类问题,但标准的支持向量机是基于分类精度进行优化的,对两类邮件的重要性未以区别,造成了邮件分类时虽然整体精度较高,但对正常邮件的误判率也较高.据此笔者提出了一种基于加权支持向量机的垃圾邮件过滤算法,通过增加两类邮件的类别权重及反映每封邮件重要性的权重,对支持向量机分类器进行训练,在保证分类精度的同时,尽可能地降低对正常邮件的误判率.实验表明该算法取得了很好的过滤效果.  相似文献   

2.
基于Boosting算法的垃圾邮件过滤方法研究   总被引:2,自引:2,他引:0  
为解决垃圾邮件过滤的精确度和有效性问题,提出了一种基于邮件内容过滤的垃圾邮件过滤方法,该方法采用Boosting算法构造了一种垃圾邮件过滤器,利用该垃圾邮件过滤器实现对垃圾邮件的过滤. 本文借鉴文本分类和信息检索领域所使用的评价指标,构建了垃圾邮件过滤器的评价体系,利用该评价体系,针对基于Boosting算法所构造的垃圾邮件过滤器对垃圾邮件的过滤实验所得到的数据进行了测试和评估,测试和评估的结果验证了Boosting算法在垃圾邮件过滤中的有效性,其性能优于传统的贝叶斯算法.   相似文献   

3.
针对现有贝叶斯算法应用于垃圾邮件过滤时,贝叶斯贝努利模型对邮件文本特征向量进行处理不能区分特征向量的重要性,导致邮件分类召回率低,同时还存在合法邮件被误判的风险的问题,采用贝叶斯多项式模型对特征向量进行加权处理来区分特征向量的重要性;然后,采用低风险策略来降低合法邮件被误判的风险,提出基于多项式模型和低风险的贝叶斯垃圾邮件过滤算法.实验结果表明:对于不同数量的特征项,该算法能够有效提高邮件分类的正确率与召回率,降低合法邮件被误判的风险,并在过滤文本字符数量较大的邮件时,具有性能平稳、波动小的特点.  相似文献   

4.
随着internet的快速发展,垃圾邮件泛滥成灾.面对垃圾邮件日益严重的现状,提出了贝叶斯邮件过滤模型并讨论了贝叶斯分类方法在垃圾邮件过滤中的应用.针对难以获得大量有类别标签的邮件训练集问题,利用贝叶斯具有增量学习特征,分析并提出了基于小规模训练集的贝叶斯增量邮件过滤方法,通过最小化当前邮件分类器的分类损失,来选择有利于提高分类器性能的邮件加入训练集.实验结果表明,该方法是切实可行的并具有良好的效果.  相似文献   

5.
基于生物序列模式提取技术的邮件过滤算法   总被引:3,自引:0,他引:3  
为了解决垃圾邮件过滤问题,考虑到中文垃圾邮件的特点和过滤系统的效率要求,应用生物信息化技术中模式提取算法TEIRESIAS的原理,设计了基于生物序列模式提取技术的垃圾邮件过滤算法BioMatrix,并实现了基于此算法的中英文邮件过滤系统.过滤系统由数量控制过滤提供垃圾邮件训练集,通过提取其中的特征模式对邮件进行分类,可以识别出约94.2%的垃圾邮件,误过滤率约0.04%.与Bayes过滤算法对比的实验结果表明,将生物序列模式提取技术应用于邮件过滤具有较好的研究和实用价值.  相似文献   

6.
分析目前基于邮件内容过滤技术存在的缺陷,根据垃圾邮件的大量发送和不请自来的行为特征,提出了一种垃圾邮件行为过滤技术.该技术将各邮件服务器组成一个垃圾邮件协作过滤网络,邮件服务器发送邮件时判断其发送行为,然后将发送行为信息加密;在MTA会话阶段,接收方先解密邮件发送行为信息,然后将不请自来的群发行为垃圾邮件进行过滤.实验结果表明,该技术在MTA会话通信阶段能过滤大量不请自来的垃圾邮件,具有较高的准确率和查全率,处理速度也较快,节省大量的网络资源,具有良好的过滤性能.  相似文献   

7.
基于Morphology处理和主题词抽取的垃圾邮件过滤方法   总被引:4,自引:0,他引:4  
考虑到垃圾邮件预处理的重要性,提出了利用Morphology对垃圾邮件内容进行还原.为了提高邮件分类的性能,对邮件进行主题词抽取,并且结合邮件其他的属性特征,利用贝叶斯方法对邮件进行分类.实验表明,这种基于Morphology处理和主题词抽取的垃圾邮件过滤方法十分有效.  相似文献   

8.
分析了E-mail邮件协议和邮件格式特征,设计与实现了一种客户端垃圾邮件过滤系统.系统采用黑白名单过滤、邮件特征过滤和贝叶斯分类相结合的三层过滤技术,并通过用户反馈机制降低误报率.实验结果显示,系统可满足用户对邮件的个性需求,提高了对垃圾邮件过滤的准确性.  相似文献   

9.
系统以垃圾邮件过滤为目标,设计并实现了一个垃圾邮件过滤系统SpamBlocker.该系统整合规则过滤、贝叶斯分类、病毒检测和黑/白名单等垃圾邮件检测技术,采用评分方法判断邮件的垃圾性,并利用规则过滤给贝叶斯分类提供学习样本,提高了系统对新垃圾邮件的适应性.  相似文献   

10.
随着电子邮件的广泛使用,垃圾邮件问题也日益严峻.基于邮件内容的过滤是当前解决垃圾邮件问题的主流技术之一.提出了一种基于带有模糊隶属度的模糊支持向量机对中文垃圾邮件过滤的方法,同时,为解决FSVM中隶属度函数的确定问题,使用了一种改进的基于类中心的隶属度函数设计方法.通过实验,使用FS-VM对垃圾邮件过滤能够取得较好的效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号