一种面向聚类的文本建模方法 |
| |
引用本文: | 唐晓丽,白宇,张桂平,蔡东风.一种面向聚类的文本建模方法[J].山西大学学报(自然科学版),2014(4):595-600. |
| |
作者姓名: | 唐晓丽 白宇 张桂平 蔡东风 |
| |
作者单位: | 沈阳航空航天大学知识工程研究中心; |
| |
基金项目: | 辽宁省教育厅科学技术研究项目(L2013066) |
| |
摘 要: | 借鉴主题模型的思想,利用word2vec训练数据的高效性以及词聚类结果的有效性,提出了一种基于word2vec的文本建模方法。该方法以word2vec算法得到的词聚类结果为基础,统计文本在词聚类类别上的概率分布,获得文本在类别空间上的特征向量,完成文本建模。将其与两种经典的文本建模方法 VSM和LDA进行比较,实验结果显示在聚类效果上F值分别提高6.01%、1.01%,在算法效率上有明显的提高。
|
关 键 词: | 主题模型 word2vec 文本建模 文本聚类 |
本文献已被 CNKI 等数据库收录! |
|