首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
垃圾邮件过滤技术研究   总被引:1,自引:0,他引:1  
详尽介绍了现有的电子邮件过滤技术,分析了各种技术的特点,比较了它们的优缺点.对未来的研究方向进行了展望,提出了若干值得研究的问题.  相似文献   

2.
垃圾邮件过滤算法研究   总被引:1,自引:0,他引:1  
对当前垃圾邮件过滤技术进行了深入研究,讨论了支持向量机分类器在智能垃圾过滤中的应用,分析了SVM算法的不足.结合k近邻算法,提出了一种基于支持向量的改进分类器,并通过大量实例对该分类器的有效性进行了验证.  相似文献   

3.
基于源地址约束的垃圾邮件过滤模型   总被引:2,自引:0,他引:2  
提出了一种基于关联规则的垃圾邮件挖掘算法,通过计算邮件源地址和邮件关键词的支持度来定位垃圾邮件源地址.该算法在Apriori算法基础上进行了改进,增加了邮件源地址和关键词约束,与基于关键词过滤算法相比提高了准确率,与基于语义分析的过滤算法相比降低了算法复杂度.实验结果表明,该算法的误判率在邮件数量增加到350封时会减小到4%,其过滤速度也会随着邮件的增加而提高。  相似文献   

4.
随着电子邮件在日常生活中多方面的灵活应用,大批量垃圾邮件的产生在很大程度上干扰了用户对电子邮件的使用.针对垃圾邮件过滤的研究现状,在阐述目前垃圾邮件过滤研究成果基础上,重点描述了具备高性能、低误判率的贝叶斯算法,并以贝叶斯算法、反馈学习技术为原理,利用Microsoft Visual C++6.0实现了垃圾邮件过滤系统.  相似文献   

5.
垃圾邮件的过滤是一个具有重要现实意义的课题.将交叉覆盖学习算法和向量空间模型等技术相结合可得到一种新的垃圾邮件过滤方法.实验结果表明该方法识别率较高,具有较强的实用价值.  相似文献   

6.
系统以垃圾邮件过滤为目标,设计并实现了一个垃圾邮件过滤系统SpamBlocker.该系统整合规则过滤、贝叶斯分类、病毒检测和黑/白名单等垃圾邮件检测技术,采用评分方法判断邮件的垃圾性,并利用规则过滤给贝叶斯分类提供学习样本,提高了系统对新垃圾邮件的适应性.  相似文献   

7.
介绍了采用贝叶斯统计法过滤垃圾邮件的算法,通过简单贝叶斯过滤算法的研究,引入了派生的贝叶斯过滤算法——零散二元多项式散列法过滤技术,它能够处理单个的特征词和变异的特征词汇.零散二元多项式散列法和贝叶斯统计法的整合,可以建立一个功能强大的垃圾邮件过滤器.  相似文献   

8.
由于目前尚无论文使用类神经网络针对中文内容的邮件进行垃圾邮件的辨识,因此希望通过实验了解,使用类神经网络对于垃圾邮件的辨识是否可行。关键词数目对于垃圾邮件的辨识是否会有影响;将邮件分类使用二分法以及实际使用测试资料中垃圾邮件的七个分类加上正常邮件共八类,此两种分类结果,对于使用类神经网络辨识垃圾邮件是否会有影响。  相似文献   

9.
为解决垃圾邮件过滤的精确度和有效性问题,提出了一种基于邮件内容过滤的垃圾邮件过滤方法,该方法采用Boosting算法构造了一种垃圾邮件过滤器,利用该垃圾邮件过滤器实现对垃圾邮件的过滤. 本文借鉴文本分类和信息检索领域所使用的评价指标,构建了垃圾邮件过滤器的评价体系,利用该评价体系,针对基于Boosting算法所构造的垃圾邮件过滤器对垃圾邮件的过滤实验所得到的数据进行了测试和评估,测试和评估的结果验证了Boosting算法在垃圾邮件过滤中的有效性,其性能优于传统的贝叶斯算法.   相似文献   

10.
针对垃圾邮件的过滤,提出了一种基于免疫算法的垃圾邮件过滤方法,并给出相应的实现算法。免疫算法具有很强的学习、识别、容错性、记忆和特征提取的能力,基于免疫算法的垃圾邮件过滤在动态性和自适应性等方面具有明显的优势,因此免疫算法较传统算法更加适用于针对于垃圾邮件的过滤。本文通过仿真实验验证了基于免疫算法的垃圾邮件过滤方法对垃圾邮件过滤的能力,实验结果表明,与传统算法贝叶斯算法的相比,基于免疫算法的垃圾邮件过滤更具有效性。  相似文献   

11.
 决策树算法是数据挖掘领域的重要算法之一.文章首先对决策树算法的数据进行逻辑描述,然后使用保险公司客户数据来构建决策树,利用Prolog语言实现了基于逻辑描述的ID3算法,尝试了用逻辑推理方法解决数据挖掘问题,并对结果进行了分析.  相似文献   

12.
对我国树木营养器官进行分类,提出了树木类型的特征与检索,并对科、属、各作全面统计和分析。结果表明我国野生和引种的树木共213科1549属11942种,单叶树种多于复叶树种,单叶的属、种各占66%及78%,复叶的属、种各占20%及16%。如按单叶脉型统计,羽状脉的属、种各占71%及77.5%,掌状脉的属、种各占24%及16%,纵向平行脉的属、种各占5%及6.5%。在对各个类型的代表 树种及科属划分的主线作归纳和研讨的基础上,从分枝式、髓型、芽型、维管束型、三级及较高度的脉序、内含物及附属物等提出了树木营养器官分类探索的线索与途径。  相似文献   

13.
数据挖掘的目标是在海量数据集中寻找和分析某些内涵信息,其数据分析的方法对结果集有很大的影响. 通过改进决策树算法的数据结构,产生分类关联规则并进行规则剪枝,实现了决策树的CMAR(Accurate and Efficient Classification Based on Multiple Class-Association Rules)生成算法;实验表明CMAR算法具有快速和精确度高的优点,具有一定的应用前景.  相似文献   

14.
设计了一种基于数据挖掘方法的邮件过滤器系统原型,并给出了这个系统原型的实现方法,  相似文献   

15.
关联规则应用最频繁的是在零售部门,尤其是超市。以某超市一天中的商品销售记录为例来说明关联规则的应用,从中发现客户的购买模式和消费习惯。决策树分类方法的应用中,对于汽车销售公司的客户定位进行了分析,区分了男性和女性的偏好。销售公司可以据此对客户进行具体定位,促进销售。  相似文献   

16.
传统的ID3决策树算法存在诸多不足,如计算效率低、多值偏向等,对此,提出了属性值空缺、多值属性的选择以及属性选择标准方面的改进方案,并将加权熵和简化熵引入决策树算法以改进传统ID3算法.实验结果表明,改进后的算法在整体性能方面较目前广泛应用的ID3算法有更优秀的性能表现.  相似文献   

17.
主要介绍如何建立最大熵模型以及应用最大熵模型实现垃圾邮件过滤的基本原理和方法.  相似文献   

18.
针对ID3决策树生成法中存在的缺点,通过引用属性关联度和代价敏感学习,提出了一种基于属性关联度和代价敏感学习的决策树生成法。该方法利用粗糙集理论对条件属性进行约减,在构建决策树过程中,把属性的关联程度和性价比作为选择分裂结点的依据,利用改进的信息增益方法构建代价敏感决策树。试验结果表明,该方法在分类准确度和生结点总数量上比常用决策树生成方法优越。  相似文献   

19.
针对ZPW-2000A无绝缘轨道电路故障逻辑机理模糊的问题,本文采用了基于决策树的轨道电路专家系统知识表示方法.该方法首先将轨道电路故障影响较大的特征向量样本建立故障决策表,然后运用最小信息熵算法对属性值离散化,根据决策树算法快速学习及分类的特点对离散后的数据样本进行训练学习,生成故障决策树后进行知识规则的获取,在专家系统的知识库中以产生规则存储.通过对ZPW-2000A无绝缘轨道电路的实例分析验证了该方法在轨道电路专家系统知识表示与获取中的有效性和实用性.  相似文献   

20.
王英 《科学技术与工程》2011,11(30):7375-7378,7385
电网调度中心报警信息中的大量噪声信息不仅加重了调度员的工作量,而且严重影响了事故异常处理的准确性和快速性。为了对报警信息进行噪声滤除,分析了决策树算法中C4.5算法的信息增益率的计算原理和特点,针对其计算量大的特点,对原C4.5算法进行改进,使其在相同准确率的情况下有更高的计算效率。将改进后的C4.5算法应用到报警信息噪声处理中。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号