首页 | 本学科首页   官方微博 | 高级检索  
     

基于频繁2-项集的贝叶斯分类器
引用本文:王东,熊世桓,向程冠,靳宁. 基于频繁2-项集的贝叶斯分类器[J]. 兰州理工大学学报, 2013, 39(4): 99-104
作者姓名:王东  熊世桓  向程冠  靳宁
作者单位:1. 贵州师范学院数学与计算机科学学院,贵州贵阳,550018
2. 贵州财经大学信息学院,贵州贵阳,550018
基金项目:贵州省优秀科技教育人才省长专项资金
摘    要:针对NB分类方法中过于严格的独立性假设,应用频繁2-项集为分类测度,通过放宽独立性假设达到改善分类性能的目的.在训练阶段使用类似Apriori关联规则发现算法挖掘并建立频繁2-项集库,当测试新文档时,文档特征通过竞争搭配生成基于测试文档的频繁2-项集序列,优先选择类词频率和置信度综合评分最高的频繁2-项集进入概率估算过程,并用频繁2-项集的综合评分置换NB的单项特征概率估计.在不同数据集的实验中显示,基于频繁2-项集的贝叶斯分类器(TIB)的分类精度整体上好于NB分类器,是一种有效的分类方法.

关 键 词:文本分类  朴素贝叶斯分类器  关联规则  项集  频繁项集

Bayesian classifier based on frequent 2-itemsets
WANG Dong , XIONG Shi-huan , XIANG Cheng-guan , JIN Ning. Bayesian classifier based on frequent 2-itemsets[J]. Journal of Lanzhou University of Technology, 2013, 39(4): 99-104
Authors:WANG Dong    XIONG Shi-huan    XIANG Cheng-guan    JIN Ning
Affiliation:1.Mathematics and Computer Science Institute,Guizhou Normal College,Guiyang 550018,China;2.School of Information,Guizhou University of Finance and Economics,Guiyang 550018,China)
Abstract:
Keywords:text categorization  Naive Bayes classifier  association rule  itemsets  frequent itemsets
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号