首页 | 本学科首页   官方微博 | 高级检索  
     

改进的TAN构造算法及其文本分类
引用本文:石洪波,黄厚宽,景丽萍. 改进的TAN构造算法及其文本分类[J]. 太原师范学院学报(自然科学版), 2002, 1(1): 20-26
作者姓名:石洪波  黄厚宽  景丽萍
作者单位:1. 山西财经大学信息与管理学院,山西,太原,030006
2. 北方交通大学计算机与信息技术学院,北京,100044
摘    要:朴素贝叶斯分类器是当前流行的一种文本分类算法,但是它的属性独立性假设使其无法表达文本词语之间的依赖关系,TAN(Tree Augmented NaIeve Bayes)在许多情况下优于朴素贝叶斯分类器。然而,由于学习TAN所需的空间是数据属性个数的二次项级,限制了TAN对高维数据(如:文本数据)的分类,本文介绍了TAN模型及其一般的构造算法,提出一种新的TAN构造算法ITAN,该算法的空间复杂度是数据属性个数的线性级,最后将该算法用于文本分类,实验比较了朴素贝叶斯分类器和TAN分类器,实验结果表明:该方法具有较好的分类性能。

关 键 词:文本分类 TAN 朴素贝叶斯 贝叶斯网 算法 数据分类
文章编号:1672-2027(2002)01-0020-07
修稿时间:2002-09-15

An Improved Algorithm for Constructing TAN and Text Classification
Abstract:
Keywords:TAN
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号