首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于指数分布族的类特定文本分类算法
引用本文:刘云,黄荣乘.基于指数分布族的类特定文本分类算法[J].重庆邮电大学学报(自然科学版),2019,31(5):694-701.
作者姓名:刘云  黄荣乘
作者单位:昆明理工大学 信息工程与自动化学院,昆明,650050;昆明理工大学 信息工程与自动化学院,昆明,650050
基金项目:国家自然科学基金(61262040
摘    要:在文本分类中,选取一个高效的分类算法是提高文本分类准确度,缩短分类时间的关键。提出基于指数分布族的多项式贝叶斯类特定分类算法(exponential family-multinomial naive Bayes,EF-MNB),基于多项式模型构造了N个类的分布,利用类特定特征选择算法得到第N个类的特征子集及对应类的特征概率密度函数(probability density function,PDF),通过指数分布族构造了N个类的原始PDF估计表达式,给定N个类的训练集,得到了第N个类的最优PDF估计,并基于贝叶斯定理制定了分类规则。仿真结果表明,与基于文档主题生成模型和支持向量机(latent dirichlet allocation-support vector machine,LDA-SVM)的层次分析分类算法、改进的超球支持向量机(improved hyper-sphere support vector machine,IHS-SVM)文本分类算法和基于主成份分析和k最近邻(principal component analysis-k-nearest-neighbor,PCA-KNN)混合分类算法相比,EF-MNB类特定分类算法使用少量的时间就可获得更高分类准确率。

关 键 词:指数分布族  类特定特征选择  类条件概率密度函数  多项式朴素贝叶斯分类器  文本分类
收稿时间:2018/6/14 0:00:00
修稿时间:2019/2/27 0:00:00

Class-specifictext classification algorithm based on exponential family
LIU Yun and HUANG Rongcheng.Class-specifictext classification algorithm based on exponential family[J].Journal of Chongqing University of Posts and Telecommunications,2019,31(5):694-701.
Authors:LIU Yun and HUANG Rongcheng
Institution:Faculty of Information Engineering andAutomation,Kunming University of Science and Technology,Kunming 650050,P.R.China and Faculty of Information Engineering andAutomation,Kunming University of Science and Technology,Kunming 650050,P.R.China
Abstract:
Keywords:exponential family  class-specific feature selection  class conditional probability density function  multinomial naive Bayes classifier  text classification
本文献已被 万方数据 等数据库收录!
点击此处可从《重庆邮电大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《重庆邮电大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号