首页 | 本学科首页   官方微博 | 高级检索  
     检索      

四维文档向量模型的k-means新闻文本聚类算法
引用本文:高飞,鱼江,任芳,黄保瑞,次旺多吉.四维文档向量模型的k-means新闻文本聚类算法[J].西藏大学学报,2013(4).
作者姓名:高飞  鱼江  任芳  黄保瑞  次旺多吉
作者单位:西藏大学工学院 西藏拉萨850000
基金项目:2011年度西藏自治区大学生创新性实验训练计划项目"基于向量空间模型的藏文文本倾向性分析系统的设计与实现"阶段性成果,项目号:2011CX051
摘    要:传统3DVM(3-Dimension Document Vector Model)由于没有使用新闻报道的时间因子,这使得该模型表示的新闻报道具有不准确性,进而影响新闻报道的聚类结果.本研究在三维文档向量模型的基础上加入了时间因子,提出了四维文档向量模型表示新闻报道.最后,用k-means聚类算法进行新闻报道的的无监督聚类.实例验证结果表明本文提出的4DVM和k-means相结合的聚类算法优于3DVM以及VSM(vector space mode)和k-means相结合的聚类算法.

关 键 词:4DVM  新闻文本  k-means聚类

k-means News Texts Clustering Algorithm Based on 4-Dimensional Document Vector Model
Institution:Gao-fei Yu-jiang Ren-fang Huang Bao-rui Ciwang-Duoji
Abstract:
Keywords:
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号