基于互信息与贝叶斯信念网络的关系层次距离混合聚类算法 |
| |
引用本文: | 蔡金成,孙浩军.基于互信息与贝叶斯信念网络的关系层次距离混合聚类算法[J].汕头大学学报(自然科学版),2018(2). |
| |
作者姓名: | 蔡金成 孙浩军 |
| |
作者单位: | 汕头大学工学院 |
| |
摘 要: | 聚类是数据挖掘中重要的功能算法,其主要的功能是发现数据中潜在的知识.目前文献发表的聚类算法多数仅限于处理单一数值型数据或者分类型数据,其主要原因是含有多种类型的混合型数据间的相似性很难度量.本文提出了一种混合数据相似性度量方法:对于分类型属性,利用互信息构建贝叶斯信念网络,利用贝叶斯信念网络构建关系层次,继而为层次附上距离,形成关系层次距离,而对于数值型属性则利用标准化的曼哈顿距离来度量其相似性,最后结合分类型属性与数值型属性来对整个数据集进行相似性的度量.在此基础上,设计实现了用于混合型数据聚类算法CRHD,并通过UCI中的多个数据集和已有算法进行仿真实验对比,证明了CRHD算法的有效性.
|
本文献已被 CNKI 等数据库收录! |
|