基于融合LDA和Doc2vec算法的文本表示模型的研究 |
| |
引用本文: | 宁宁,莫秀良,王春东,佟寅铖.基于融合LDA和Doc2vec算法的文本表示模型的研究[J].天津理工大学学报,2021(2):55-60. |
| |
作者姓名: | 宁宁 莫秀良 王春东 佟寅铖 |
| |
摘 要: | 在文本分类的过程中,由于文本数据具有非结构化、高维性、稀疏性的特征,常常会导致分类效果的不理想.由此可知,文本分类的准确性十分依赖于文本表示的效果.本文通过融合Latent Dirichlet Allocation和Doc2vec算法得到一种新的主题向量表示和文档向量表示,再通过计算其中的余弦相似度来提取文本特征.该方...
|
关 键 词: | LDA Doc2vec 文本表示 特征选择 文本分类 |
|
|