排序方式: 共有5条查询结果,搜索用时 15 毫秒
1
1.
基于核密度估计的层次聚类算法 总被引:12,自引:0,他引:12
聚类分析是统计、模式识别和数据挖掘等领域中一个非常基础且非常重要的研究课题,具有广泛的应用前景。在众多的聚类方法中,基于密度的方法是一种相当有效的聚类方法,能够发现任意形状的聚类,对噪声数据不敏感,但是聚类结果严重依赖于用户参数的合理选择。以DENCLUE算法为基础,一种基于核密度估计的层次聚类算法被提出,该算法首先优选窗宽σ产生较好的核密度估计结果,然后以密度函数的局部极大值点为聚类中心形成数据的初始划分,最后根据密度函数的鞍点递归合并初始聚类产生不同层次的划分模式。理论分析和仿真实验结果显示,该算法能够发现任意形状、大小和密度的聚类,能够有效处理噪声数据,而且聚类结果不依赖于用户参数的仔细选择。 相似文献
2.
一个小型演员合作网的拓扑性质分析 总被引:3,自引:0,他引:3
从著名的网络电影社区--MTime网站,获取了国内(大陆、香港、澳门、台湾)近6年来(2001~2006年)拍摄电影的数据.应用复杂网络的理论和方法,对其中的演员合作关系所形成的网络进行了初步研究.分析结果表明:与其他广义合作网络类似,中国电影演员合作网络也具有明显的聚类效应和小世界特性.此外,对历年网络及其最大连通群组也进行了网络简约和社区分析,相关研究结果与实际情况相符,对中国电影发展趋势的预测也有一定的参考价值. 相似文献
3.
聚类分析是数据挖掘领域中一个基础而活跃的研究课题。由于大多数的聚类方法在处理高维数据时会出现高维失效问题,维简约成为高维聚类中一个非常重要的处理步骤。通过分析对象间相似性度量与原始数据分布间的关系,提出一种基于熵的特征筛选方法。该方法通过构造一个基于对象间相似度的熵度量,对原始特征集中的每个特征进行重要性评估,从而获得重要特征子集。实验结果显示,该方法可以有效剔除高维数据集中的不重要或噪声特征,改善聚类算法的性能和聚类结果的可理解性。 相似文献
4.
面对大量的涉税数据,为揭示纳税个体间内在的分类特性,发现其中偏离常规的异常纳税行为等,有效提高税源监管力度,针对税源监管的应用需求,分析了数据挖掘中常用聚类算法的特性,提出了基于DENCLUE密度聚类的改进方法。该方法不仅可以发现数据分布的典型聚簇模式,而且可以揭示对税源监管更有价值的离群模式。应用实践验证了该方法的有效性。 相似文献
5.
1