首页 | 本学科首页   官方微博 | 高级检索  
     检索      

中文垃圾邮件过滤系统的实现和评估
引用本文:李星,田莹,段海新.中文垃圾邮件过滤系统的实现和评估[J].大连理工大学学报,2005,45(Z1):189-195.
作者姓名:李星  田莹  段海新
作者单位:1. 清华大学,新一代网络技术与应用实验室,北京,100084
2. 清华大学,信息网络工程研究中心,北京,100084
摘    要:垃圾邮件是长期以来困扰电子邮件使用者的一个问题,反垃圾邮件技术除了可以抑制垃圾邮件,对反垃圾短信和垃圾VoIP电话等问题也有借鉴意义. 为此,对使用贝叶斯方法过滤垃圾邮件进行了介绍,阐述了中文垃圾邮件过滤系统的实现,并给出了评估结果. 结果表明,在过滤中计算最终概率的特征数目以及用于训练的样本个数都存在某个最优值,当用于训练的样本个数逐渐超过这个最优值时,过滤效果会略微下降并趋于一致.

关 键 词:垃圾邮件  贝叶斯  过滤器
文章编号:1004-5619(2005)04-S19-01
修稿时间:2005年5月8日

Implementation and evaluation of Chinese spam filtering system
LI Xing,TIAN Ying,DUAN Hai-xin.Implementation and evaluation of Chinese spam filtering system[J].Journal of Dalian University of Technology,2005,45(Z1):189-195.
Authors:LI Xing  TIAN Ying  DUAN Hai-xin
Abstract:Spam has been a serious problem to email users for a long time.Anti-spam technique can be used to block not only spam but also unsolicited commercial mobile messages and VoIP phones.Here the authors give a survey of bayes filtering,introduce a Chinese spam filtering system and show the evaluation.It is shown that there are certain optimized values for the size of the training aggregate and the token numbers that are calculated to the final probability.If the size of the training aggregate exceeds the optimum value,the filtering effect will decrease a little and go to a constant as the aggregate size increases.
Keywords:spam  bayes  filter
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号