排序方式: 共有4条查询结果,搜索用时 15 毫秒
1
1.
2.
对于所要研究主体的认知诊断需要从多个属性去认识,认知需要提取数据集的特征,认识事物间的本质及区别能够帮助人们更好地做出科学的决策,然而数据特征的提取往往会受特征库的影响,而忽略形成属性特征之间的关系。应用Q矩阵表达事物之间的关联,结合数据挖掘中的关联分析理论,找出数据的属性元素之间的关联,定义属性权重、路径权重、边权重,以强调关联性的类型和权重。实验证明,属性权重值属性间关联权重值计算方式,权重越大,对特征提取的贡献值也越大,数据集特征同样也取决于属性间路径权重,如果某路径值越大,代表着该路径趋势越明显,出现的概率越大,反之,概率越小。方法论研究可以应用到主体(比方说公司,客户,人际关系等)间关联性研究,并为之提供科学的依据。 相似文献
3.
4.
孤立点的存在使聚类中心的计算产生较大误差,影响K-means算法的聚类效果.针对该问题,引入谢林模型,使孤立点能够自动移动到其邻居所在位置,消除孤立点,同时,对K-means算法过程中的距离计算、初始聚类中心选取环节进行改进,提出基于孤立点自适应的K-means算法.该算法首先对原始数据进行归一化处理,以提高距离计算的准确性;然后,根据谢林模型的基本思想,将孤立点移动到其最近的多邻邻居;接着,由类簇的数目确定邻居样本的搜索范围,确定初始聚类中心;最后,根据移动后的数据集和初始聚类中心,进行K-means聚类.在UCI机器学习数据库中经典聚类数据集上的实验结果表明,该算法可显著提升聚类的精度,同时,簇的内聚性也比较好. 相似文献
1