四维文档向量模型的k-means新闻文本聚类算法 |
| |
引用本文: | 高飞,鱼江,任芳,黄保瑞,次旺多吉.四维文档向量模型的k-means新闻文本聚类算法[J].西藏大学学报,2013(4). |
| |
作者姓名: | 高飞 鱼江 任芳 黄保瑞 次旺多吉 |
| |
作者单位: | 西藏大学工学院 西藏拉萨850000 |
| |
基金项目: | 2011年度西藏自治区大学生创新性实验训练计划项目"基于向量空间模型的藏文文本倾向性分析系统的设计与实现"阶段性成果,项目号:2011CX051 |
| |
摘 要: | 传统3DVM(3-Dimension Document Vector Model)由于没有使用新闻报道的时间因子,这使得该模型表示的新闻报道具有不准确性,进而影响新闻报道的聚类结果.本研究在三维文档向量模型的基础上加入了时间因子,提出了四维文档向量模型表示新闻报道.最后,用k-means聚类算法进行新闻报道的的无监督聚类.实例验证结果表明本文提出的4DVM和k-means相结合的聚类算法优于3DVM以及VSM(vector space mode)和k-means相结合的聚类算法.
|
关 键 词: | 4DVM 新闻文本 k-means聚类 |
k-means News Texts Clustering Algorithm Based on 4-Dimensional Document Vector Model |
| |
Institution: | Gao-fei Yu-jiang Ren-fang Huang Bao-rui Ciwang-Duoji |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 维普 等数据库收录! |
|