首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于尾项加权的自适应文本分类方法研究
引用本文:赖英旭,许昕,杨震.基于尾项加权的自适应文本分类方法研究[J].中国科学技术大学学报,2011,41(7).
作者姓名:赖英旭  许昕  杨震
作者单位:北京工业大学计算机学院,北京,100124
基金项目:国家自然科学基金(61001178); 北京市自然科学基金(4102012); 北京市教育委员会科技发展计划面上项目(KM200810005030); 北京市高等学校人才强教深化计划“中青年骨干人才培养计划”项目(PHR201108016); 北京工业大学青年科学基金资助
摘    要:基于朴素贝叶斯分类框架,通过添加尾项值对部分严重扭曲的分类结果进行调整,达到提升分类器性能的目的.方法通过增量式自适应学习分类模式,根据历史结果,判断分类器分类质量,进而确定尾项添加区间,对明显产生分类扭曲的区间结果自适应添加尾项补偿,调整分类结果.在Trec05,Trec06,Trec07,Ceas08数据集上的对比实验表明,改进算法在accuracy,Macro F1两个指标上均比朴素贝叶斯分类器和bagging朴素贝叶斯分类器显著提高,且方法简单易行.

关 键 词:文本分类  朴素贝叶斯分类器  垃圾邮件过滤  尾项加权  

Adaptive adjustment weighted text classification
LAI Yingxu,XU Xin,YANG Zhen.Adaptive adjustment weighted text classification[J].Journal of University of Science and Technology of China,2011,41(7).
Authors:LAI Yingxu  XU Xin  YANG Zhen
Institution:LAI Yingxu,XU Xin,YANG Zhen (College of Computer Science and Technology,Beijing University of Technology,Beijing 100124,China)
Abstract:To improve the performance of the naive Bayes classifier,a method is proposed which regulates text categories by adding adjustment values to the output of the naive Bayes classifier.The classification pattern was learned in an incremental and adaptive way,and the interval during which the output of the naive Bayes classifier should be adjusted was built according to the classification performance evaluated by historical outputs.Then the adjustment value was adaptively added to the output of the naive Bayes ...
Keywords:text classification  naive Bayes  spam filtering  adaptive adjustment  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号