基于类内距离参数估计的文本聚类评价方法 |
| |
引用本文: | 牛奉高,张荣杰.基于类内距离参数估计的文本聚类评价方法[J].山西大学学报(自然科学版),2018(2). |
| |
作者姓名: | 牛奉高 张荣杰 |
| |
作者单位: | 山西大学数学科学学院 |
| |
摘 要: | 基于类内距离参数估计的文本聚类评价方法是在类内距离近似服从正态分布的基础上,运用极大似然估计方法对类内距离分布函数的参数进行估计,然后基于估计的结果确定类内距离的合理取值范围,对超过范围的文本向量依据类内距离大小依次进行调整,并利用聚类评价指标来验证最终调整结果。在实验部分文章通过使用基于类内距离参数估计的文本聚类评价方法对K-means算法生成的聚类结果进行调整,一方面验证了在聚类类别数过小或与真实类别数相同时,该方法的可行性;另一方面减弱了初始类中心的选取对K-means算法的影响,提高了聚类结果的准确性。
|
本文献已被 CNKI 等数据库收录! |
|