基于深度集成朴素贝叶斯模型的文本分类 |
| |
作者姓名: | 吴皋 李明 周稻祥 岳俊宏 肖福龙 |
| |
作者单位: | 太原理工大学 数学学院,山西太原 030024;太原理工大学 大数据学院,山西太原 030024;山西财经大学统计学院,山西太原 030006 |
| |
基金项目: | 国家重点研发计划;国家重点研发计划 |
| |
摘 要: | 针对传统朴素贝叶斯算法属于浅层学习,其特征独立性假设易引起分类效果欠佳的问题,提出一种深度集成朴素贝叶斯模型;该模型受深度森林中集成思想的启发,将高斯朴素贝叶斯、多项式朴素贝叶斯、伯努利朴素贝叶斯3种浅层基分类器集成为具有深层学习结构的朴素贝叶斯模型。结果表明:提出的深度集成朴素贝叶斯模型不仅克服了浅层学习特征表达能力不足的问题,而且缓解了特征独立性假设的缺点;通过在经典文本分类数据集上的实验,证明了提出的深度集成朴素贝叶斯模型的精确率、召回率以及精确率与召回率的调和平均数F_1值显著增大,模型性能良好。
|
关 键 词: | 朴素贝叶斯模型 浅层学习 深度森林 集成 文本分类 |
本文献已被 CNKI 万方数据 等数据库收录! |
|