首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于知识积累方法的垃圾邮件过滤算法
引用本文:王毅,谢治华,梁国彪.基于知识积累方法的垃圾邮件过滤算法[J].科学技术与工程,2007,7(11):2556-2558.
作者姓名:王毅  谢治华  梁国彪
作者单位:湖南大学经济管理数据中心,长沙,410079
基金项目:2005年湖南大学校基金和广东省关键领域重点突破项目(2005A10207003)资助
摘    要:由于垃圾邮件类型的不断变化,超出现有过滤算法模型中所采用的训练样本范围,造成过滤性能不断下降。因此,提出了一种基于知识积累方法的垃圾邮件过滤算法。利用KNN方法的惰性学习机制,将新型的垃圾邮件动态加入训练样本集中,以实现知识的不断积累过程。在此基础上,应用KNN方法对未知邮件样本进行精确匹配,以排除合法邮件的误判结果。实验表明算法具有较好的过滤性能。

关 键 词:支持向量机  朴素贝叶斯  K近邻
文章编号:1671-1819(2007)11-2556-03
修稿时间:2007-01-26

Spam Filtered Algorithm Based on Knowledge Accumulation
WANG Yi,XIE Zhi-hu,LIANG Guo-biao.Spam Filtered Algorithm Based on Knowledge Accumulation[J].Science Technology and Engineering,2007,7(11):2556-2558.
Authors:WANG Yi  XIE Zhi-hu  LIANG Guo-biao
Institution:Software College, Hunan University, Changsha 410079, P. R. China
Abstract:New variation of spam leads to exceed range of training set used in current spam filtering algorithms, and lower their performance of filtering illegal emails. To solve this problem, a new algorithm is provided based on knowledge accumulation. Using the laziness of KNN(K nearest neighbors), it automatically expands the training set with the help of new spam, and then uses KNN to classify the unlabelled emails. Experimental results also show the new algorithm with better performance on filtering spam.
Keywords:supported vector machine Naive Bayesian K-nearest neighbors
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号