首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
垃圾邮件的过滤是一个具有现实意义的课题,其自动过滤主要以关键字过滤技术为主。这种技术缺陷在于某些词词型发生变化,但仍保留其原有潜在特质,即在意义上等价时,其关键字的识别方法就不适用了。本文根据Agrawal等人的关联分析算法提出一种过滤垃圾邮件的方法,即根据词项的潜特征进行判定,从而提高垃圾邮件的识别率。  相似文献   

2.
分析了E-mail邮件协议和邮件格式特征,设计与实现了一种客户端垃圾邮件过滤系统.系统采用黑白名单过滤、邮件特征过滤和贝叶斯分类相结合的三层过滤技术,并通过用户反馈机制降低误报率.实验结果显示,系统可满足用户对邮件的个性需求,提高了对垃圾邮件过滤的准确性.  相似文献   

3.
针对垃圾邮件中往往会包含指向目标地址的链接的特征,提出一种新颖的垃圾邮件过滤方法.该方法提取邮件体中的链接,将其相关特征表示成一个向量,运用机器学习技术对其进行训练分类.实验结果表明,该技术是一种快速有效的垃圾邮件过滤技术.特别地,由于在垃圾邮件中添加链接对垃圾邮件发送者来说几乎是不可避免的,该技术也被认为是非常可靠的.  相似文献   

4.
垃圾邮件过滤中特征选择方法研究   总被引:2,自引:0,他引:2  
文章对垃圾邮件过滤中的特征选择问题进行了研究,引入"词共现模型"考虑词语之间的语义联系信息,和传统的信息增益特征选择方法结合表示邮件,采用神经网络方法对邮件进行分类得到垃圾邮件过滤器.实验表明,文章提出的将词共现对和信息增益结合的特征选择方法能够提高垃圾邮件过滤的精确度.  相似文献   

5.
电子邮件作为网络应用的一个重要方面已成为现代通信中不可缺少的一部分,但是垃圾邮件的蔓延给用户带来了严重的损失,如何防范垃圾邮件具有重要的实用意义.在分析了垃圾邮件特点的基础上,构建贝叶斯分类模型,利用贝叶斯分类模型设计了一种邮件过滤系统.实验结果表明,设计的邮件过滤系统对垃圾邮件的过滤具有比较明显的效果.  相似文献   

6.
提出了一种基于支持向量机的改进分类方法.该方法将特征空间分类超平面附近的样本分类,交由特征空间和样本空间中的K-近邻集体投票表决.该方法应用于垃圾邮件的过滤,邮件合法性误判发生的概率可被有效降低.最后通过垃圾邮件过滤实例对本文所述方法的有效性进行了验证.  相似文献   

7.
随着internet的快速发展,垃圾邮件泛滥成灾.面对垃圾邮件日益严重的现状,提出了贝叶斯邮件过滤模型并讨论了贝叶斯分类方法在垃圾邮件过滤中的应用.针对难以获得大量有类别标签的邮件训练集问题,利用贝叶斯具有增量学习特征,分析并提出了基于小规模训练集的贝叶斯增量邮件过滤方法,通过最小化当前邮件分类器的分类损失,来选择有利于提高分类器性能的邮件加入训练集.实验结果表明,该方法是切实可行的并具有良好的效果.  相似文献   

8.
日益泛滥的图像垃圾邮件给互联网用户带来极大的不便,如何对其实施有效过滤成为亟待解决的问题.分析图像垃圾邮件过滤中的关键问题邮件图像的特征提取.利用垃圾邮件重复发送、内容高度相似的特点,提出一种过滤图像垃圾邮件的新方法:提取邮件图像的综合特征值,以此作为目标邮件图像与垃圾邮件图像样本库相似性度量的依据,通过检测其是否相似来实现垃圾邮件图像的过滤.实验中,提取邮件图像的颜色、纹理和形状3种底层特征,其描述方法分别为颜色矩、共生矩阵统计量和不变矩.结果表明该方法对图像垃圾邮件的召回率达到95%以上.  相似文献   

9.
提出了一种基于特征项扩展的中文文本分类方法.该方法首先对文档的特征词进行分析,然后利用HowNet抽取最能代表主题的特征义原,接着根据这些义原对特征项进行扩展,并赋予扩展的特征项适当权值来说明其描述能力.最后利用扩展的特征项集提取特征进行分类.该文重点研究了如何抽取特征义原,如何给扩展项设定一个合适的权值.实验证明,该文方法能增加有效的特征项的数目,使分类正确率和稳定性均得到提高.  相似文献   

10.
提出一种面向概念漂移集成分类的基分类器三支过滤方法.首先基于信息熵理论计算出基分类器的不确定性值,并融合其准确性作为基分类器的质量度量,然后通过预设阈值 α、β 对基分类器进行三支过滤.其过滤策略为:删除质量权值小于等于阈值 β 的基分类器;保留质量权值大于等于阈值 α 的基分类器;对于质量权值大于 β小于 α的基分类...  相似文献   

11.
图像中的文本区域为判别图像垃圾邮件提供了重要依据.为了获得图像中的文本区域信息,提出了基于Hough变换提取图像中倾斜文本区域的算法和降低图像背景干扰的八邻域细小边缘去除算法,实现了一种不受图像中文本颜色、字体、大小、位置、方向限制的文本区域的自动提取方法.在包含100幅垃圾图像的数据集上进行提取图像文本区域的实验.实验结果显示,新方法具有良好的文本区域提取性能.  相似文献   

12.
针对传统的垃圾邮件过滤方法不能有效阻止出现的新型垃圾邮件的问题,借鉴生物免疫系统中疫苗的概念和免疫记忆功能,提出了一种基于疫苗机制的垃圾邮件过滤模型SFM-V(spam filtering model based on vaccine mechanism).该模型详细描述了垃圾邮件检测器的演化和抗原提呈的过程,通过疫苗控制器实现疫苗提取和疫苗接种,新生成的免疫记忆细胞作为疫苗实现信息交互,共享抗体.并引入小生境免疫记忆与共享机制,增加检测器的多样性及稳定性,促进免疫记忆库及原始抗体库中优良个体的保存,有效地提取和记忆垃圾邮件的未知特征和变异特征.利用CCERT(china education and research network)的邮件样本集对该模型进行训练和检测,仿真实验结果表明该模型有效地提高了垃圾邮件的正确率、召回率等特性,降低了垃圾邮件的虚报率.  相似文献   

13.
介绍基于HTML标签的卡方分布算法在垃圾邮件过滤中的应用。首先对通过浏览器收集到的邮件进行分析,将其转换为HTML源代码的形式,再根据HTML语言的特点对其进行特征提取,从而达到邮件预处理的目的。随后采用LVQ神经网络建立分类器模型,以达到最终分离正常邮件(ham)和垃圾邮件(spam)的目的。对比实验表明,结合HTML代码的卡方分布特征提取和LVQ神经网络的分类器模型效果更好。  相似文献   

14.
为了提高垃圾邮件样本的覆盖率和实时性,降低垃圾邮件过滤系统的计算复杂性和滞后性,提出了基于垃圾邮件发送的行为特征,采用蜜罐原理进行垃圾邮件样本采集.引入蜜罐帐户评价公式,根据这个公式设计并实现了蜜罐帐户选择算法,动态地在电子邮件服务器中选择一定数量的帐户作为蜜罐并生成蜜罐集合,定期从蜜罐集合中采集邮件样本,作为过滤系统的学习语料.实验表明,利用该方法能够使采集到垃圾邮件样本覆盖率达到98%以上.由于系统能够定期地进行样本采集,因此实时性较强,从而提高系统过滤垃圾邮件的能力.  相似文献   

15.
基于传统信息增益特征选择算法,通过提出类内分散度与类间集中度的概念,结合传统信息增益算法,解决了信息增益算法因忽略特征项的分布而导致的性能下降问题,提高了信息增益算法的效率.使用改进的特征选择算法进行垃圾邮件过滤实验,在不同的分类器下,与传统的特征选择算法进行对比,实验结果表明,改进的特征选择算法性能较优.  相似文献   

16.
由于垃圾邮件类型的不断变化,超出现有过滤算法模型中所采用的训练样本范围,造成过滤性能不断下降。因此,提出了一种基于知识积累方法的垃圾邮件过滤算法。利用KNN方法的惰性学习机制,将新型的垃圾邮件动态加入训练样本集中,以实现知识的不断积累过程。在此基础上,应用KNN方法对未知邮件样本进行精确匹配,以排除合法邮件的误判结果。实验表明算法具有较好的过滤性能。  相似文献   

17.
分析目前基于邮件内容过滤技术存在的缺陷,根据垃圾邮件的大量发送和不请自来的行为特征,提出了一种垃圾邮件行为过滤技术.该技术将各邮件服务器组成一个垃圾邮件协作过滤网络,邮件服务器发送邮件时判断其发送行为,然后将发送行为信息加密;在MTA会话阶段,接收方先解密邮件发送行为信息,然后将不请自来的群发行为垃圾邮件进行过滤.实验结果表明,该技术在MTA会话通信阶段能过滤大量不请自来的垃圾邮件,具有较高的准确率和查全率,处理速度也较快,节省大量的网络资源,具有良好的过滤性能.  相似文献   

18.
旋转机械振动信号处理中的滤波及特征提取技术   总被引:3,自引:0,他引:3  
在广泛调研国内外旋转机械振动信号处理技术研究的基础上,针对振动信号处理中的滤波和特征提取技术进行了较为详细的回顾和总结,分析了各种滤波和特征提取方法的优缺点.文中调研和总结的研究方法和技术,可为大型旋转机械振动检测与故障诊断研究提供参考.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号