首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于词项关联关系的 FCM微博聚类算法
引用本文:程玉胜,黎康,王一宾,任勇.基于词项关联关系的 FCM微博聚类算法[J].安庆师范学院学报(自然科学版),2016,22(3).
作者姓名:程玉胜  黎康  王一宾  任勇
作者单位:安庆师范大学 计算机与信息学院,安徽 安庆,246133;安庆师范大学 计算机与信息学院,安徽 安庆,246133;安庆师范大学 计算机与信息学院,安徽 安庆,246133;安庆师范大学 计算机与信息学院,安徽 安庆,246133
基金项目:安徽省高等学校自然科学基金
摘    要:针对微博内容的稀疏、高维等特征,提出了一种基于词项关联关系的模糊C均值聚类算法。该算法通过挖掘词项间语义的关联程度,将文本特征最大化,并用提前标注部分同类文本的方式来指导模糊C均值算法在初始聚类中心上的选择,从而达到优化效果。实验结果表明,该算法一定程度上克服了微博本身存在的数据稀疏性问题,能高效地进行微博聚类。

关 键 词:微博  词项关联关系  模糊聚类
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号