改进的TAN构造算法及其文本分类 |
| |
引用本文: | 石洪波,黄厚宽,景丽萍. 改进的TAN构造算法及其文本分类[J]. 太原师范学院学报(自然科学版), 2002, 1(1): 20-26 |
| |
作者姓名: | 石洪波 黄厚宽 景丽萍 |
| |
作者单位: | 1. 山西财经大学信息与管理学院,山西,太原,030006 2. 北方交通大学计算机与信息技术学院,北京,100044 |
| |
摘 要: | 朴素贝叶斯分类器是当前流行的一种文本分类算法,但是它的属性独立性假设使其无法表达文本词语之间的依赖关系,TAN(Tree Augmented NaIeve Bayes)在许多情况下优于朴素贝叶斯分类器。然而,由于学习TAN所需的空间是数据属性个数的二次项级,限制了TAN对高维数据(如:文本数据)的分类,本文介绍了TAN模型及其一般的构造算法,提出一种新的TAN构造算法ITAN,该算法的空间复杂度是数据属性个数的线性级,最后将该算法用于文本分类,实验比较了朴素贝叶斯分类器和TAN分类器,实验结果表明:该方法具有较好的分类性能。
|
关 键 词: | 文本分类 TAN 朴素贝叶斯 贝叶斯网 算法 数据分类 |
文章编号: | 1672-2027(2002)01-0020-07 |
修稿时间: | 2002-09-15 |
An Improved Algorithm for Constructing TAN and Text Classification |
| |
Abstract: | |
| |
Keywords: | TAN |
本文献已被 维普 万方数据 等数据库收录! |
|