首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种面向聚类的文本建模方法
引用本文:唐晓丽,白宇,张桂平,蔡东风.一种面向聚类的文本建模方法[J].山西大学学报(自然科学版),2014(4):595-600.
作者姓名:唐晓丽  白宇  张桂平  蔡东风
作者单位:沈阳航空航天大学知识工程研究中心;
基金项目:辽宁省教育厅科学技术研究项目(L2013066)
摘    要:借鉴主题模型的思想,利用word2vec训练数据的高效性以及词聚类结果的有效性,提出了一种基于word2vec的文本建模方法。该方法以word2vec算法得到的词聚类结果为基础,统计文本在词聚类类别上的概率分布,获得文本在类别空间上的特征向量,完成文本建模。将其与两种经典的文本建模方法 VSM和LDA进行比较,实验结果显示在聚类效果上F值分别提高6.01%、1.01%,在算法效率上有明显的提高。

关 键 词:主题模型  word2vec  文本建模  文本聚类
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号