首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于生物序列模式提取技术的邮件过滤算法
引用本文:陈蔚然,董守斌.基于生物序列模式提取技术的邮件过滤算法[J].清华大学学报(自然科学版),2005,45(9):1734-1737.
作者姓名:陈蔚然  董守斌
作者单位:华南理工大学,广东省计算机网络重点实验室,广州,510640;华南理工大学,广东省计算机网络重点实验室,广州,510640
基金项目:国家"九七三"子课题"下一代互联网安全监测和安全生态学理论研究"(2003CB314800)
摘    要:为了解决垃圾邮件过滤问题,考虑到中文垃圾邮件的特点和过滤系统的效率要求,应用生物信息化技术中模式提取算法TEIRESIAS的原理,设计了基于生物序列模式提取技术的垃圾邮件过滤算法BioMatrix,并实现了基于此算法的中英文邮件过滤系统.过滤系统由数量控制过滤提供垃圾邮件训练集,通过提取其中的特征模式对邮件进行分类,可以识别出约94.2%的垃圾邮件,误过滤率约0.04%.与Bayes过滤算法对比的实验结果表明,将生物序列模式提取技术应用于邮件过滤具有较好的研究和实用价值.

关 键 词:邮件过滤  模式提取  TEIRESIAS算法
文章编号:1000-0054(2005)S1-1734-04
修稿时间:2005年5月23日

Spam filtering algorithm based on the pattern discovery techniques of biological sequences
CHEN Weiran,DONG Shoubin.Spam filtering algorithm based on the pattern discovery techniques of biological sequences[J].Journal of Tsinghua University(Science and Technology),2005,45(9):1734-1737.
Authors:CHEN Weiran  DONG Shoubin
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号