首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种改进的贝叶斯文本分类方法
引用本文:张玉芳,陈剑敏,熊忠阳.一种改进的贝叶斯文本分类方法[J].广西师范大学学报(自然科学版),2007,25(2):206-209.
作者姓名:张玉芳  陈剑敏  熊忠阳
作者单位:重庆大学,计算机学院,重庆,400030
基金项目:重庆市自然科学基金资助项目(CSTC2006BB2021)
摘    要:朴素贝叶斯分类(naive Bayes)有一个“独立性假设”:给定一个实例的类标签,实例中的每个属性的出现都独立于实例中其他属性的出现,而在实际应用中这种条件并不易满足,另外由于文本的特殊性,相关的特征项可能会产生新的语义信息。因此在训练文本时,对特征选择后产生的特征集用一种可行的方法考察它们之间的相关性,然后对相关程度高的特征进行合并处理。实验数据表明,这个改进的方法能提高朴素贝叶斯的算法精确度。

关 键 词:文本分类  独立性假设  相关性
文章编号:1001-6600(2007)02-0206-04
收稿时间:2006-12-15
修稿时间:2006-12-15

Improved Naive Bayes Text Classification Algorithm
ZHANG Yu-fang,CHEN Jian-min,XIONG Zhong-yang.Improved Naive Bayes Text Classification Algorithm[J].Journal of Guangxi Normal University(Natural Science Edition),2007,25(2):206-209.
Authors:ZHANG Yu-fang  CHEN Jian-min  XIONG Zhong-yang
Institution:Computer Academic ,Chongqing University,Chongqing 400030 ,China
Abstract:There is an "independence hypothesis" in Bayesian classifier method:examples of the emergence of each attribute are independent from the examples of other attributes appear,the practical application of such conditions are not easily satisfied because the special version of the related characters may have new meaning in a special text.Therefore,while training the text,the characters of higher relevant can be amalgamated.The experimental data indicates,that this improved method can improve the algorithm accuracy appreciably.
Keywords:text classification  independence hypothesis  relativity
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号