基于词项关联关系的 FCM微博聚类算法 |
| |
引用本文: | 程玉胜,黎康,王一宾,任勇.基于词项关联关系的 FCM微博聚类算法[J].安庆师范学院学报(自然科学版),2016,22(3). |
| |
作者姓名: | 程玉胜 黎康 王一宾 任勇 |
| |
作者单位: | 安庆师范大学 计算机与信息学院,安徽 安庆,246133;安庆师范大学 计算机与信息学院,安徽 安庆,246133;安庆师范大学 计算机与信息学院,安徽 安庆,246133;安庆师范大学 计算机与信息学院,安徽 安庆,246133 |
| |
基金项目: | 安徽省高等学校自然科学基金 |
| |
摘 要: | 针对微博内容的稀疏、高维等特征,提出了一种基于词项关联关系的模糊C均值聚类算法。该算法通过挖掘词项间语义的关联程度,将文本特征最大化,并用提前标注部分同类文本的方式来指导模糊C均值算法在初始聚类中心上的选择,从而达到优化效果。实验结果表明,该算法一定程度上克服了微博本身存在的数据稀疏性问题,能高效地进行微博聚类。
|
关 键 词: | 微博 词项关联关系 模糊聚类 |
本文献已被 CNKI 万方数据 等数据库收录! |
|