首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 70 毫秒
1.
目的探索同时确定K-means算法的最佳聚类数K和最佳初始聚类中心的方法,使K-means算法的聚类结果尽可能地收敛于全局最优解或近似全局最优解。方法以次胜者受罚竞争学习(Rival Penalized Competitive Learning,RPCL)作为K-means的预处理步骤,以其学习结果作为K-means的聚类数和初始聚类中心并依据数据集样本自然分布定义样本密度,将此密度引入RPCL的节点权值调整,以此密度RPCL的输出作为K-means的最佳聚类数K和最佳初始聚类中心。采用UCI机器学习数据库数据集以及随机生成的带有噪音点的人工模拟数据集进行实验测试,并用不同的聚类结果评价指标对聚类结果作了分析。结果提出的密度RPCL为K-means提供了最佳的类簇数和最佳的初始聚类中心。结论基于密度RPCL的K-means算法具有很好的聚类效果,对噪音数据有很强的抗干扰性能。  相似文献   

2.
运用模糊C-均值(FCM)聚类算法对数字图书馆的图书借阅数据进行数据挖掘,并使用误判率交叉估计法验证挖掘过程的有效性.通过分析聚类挖掘结果,寻找到读者借阅图书的潜在规律,并对各类图书的借阅质量进行判断,以提高图书馆的图书利用率,进一步优化馆藏.  相似文献   

3.
基于均值密度中心估计的k-means聚类文本挖掘方法   总被引:1,自引:1,他引:0  
文本挖掘作为数据挖掘的重要研究领域,是检索有用文本信息的重要手段。通过对K-means聚类挖掘方法的基本原理和实现步骤的分析,发现随机选择聚类中心迭代初值、奇异点问题是制约其发展的技术瓶颈,针对该方法的不足,提出了一种基于均值密度中心估计的K-means聚类文本挖掘方法,采用基于均值密度的聚类中心初值估算取代原有方法的随机选取模式,设计自适应的邻域形状选择机制,用均值密度配合阈值消除奇异点。实验结果表明,提出的方法提高了K-means聚类方法的文本挖掘性能,使得文本挖掘查准率得到很大的提高,不仅强于一般K-means均值聚类方法,且和新近流行的自组织神经网络聚类方法相比也具有一定的优势。  相似文献   

4.
为提高K-means算法全局搜索能力,提升聚类效果,提出一种基于近似骨架和混合蛙跳算法的K-means方法。该方法首先利用经典的混合蛙跳算法取代K-means算法中原有迭代公式,获得更优秀的聚类结果;然后对获得的聚类结果,使用基于近似骨架和混合蛙跳算法的K-means算法不寻找聚类中心,而是直接对簇的划分进行修改。UCI数据集实验结果表明,使用改进的聚类算法获得的聚类结果,较其他算法结果更为优秀。最后将改进后的聚类算法应用到医学眼底病历图像中,可以得到较好的血管切割效果。  相似文献   

5.
将K-means聚类算法在对事物分类中的优点用于判断变压器的故障中.并针对K-means聚类法在给定初始聚类中心不良的问题上进行改进.将改进的K-means聚类算法与三比值法相结合,以此来诊断变压器的多种常见故障.应用MATLAB分别对改进前后的K-means算法进行仿真,并将改进后的仿真结果同改进前K-means聚类算法的结果进行对比分析.结果表明,改进的K-means聚类算法不但能精确、有效地对变压器故障进行诊断,并且改进的K-means聚类法使仿真结果更加准确可靠.  相似文献   

6.
传统K-means 算法对于聚类初始点的选取和距离度量的计算异常敏感,因而很可能导致K-means 算法只能收敛得到局部最优解。为此,提出一种改进的K-means 算法,即K-means 聚类算法最优匹配算法,并进行了相关的算法实验分析。该改进算法首先对传统的K-means 聚类算法进行初始点的选取,并分析聚类结果。然后,分别从初始聚类中心的选择和距离算法的确定进行实验测试,引入轮廓系数评价聚类效果,分析实验结果可知,K-means 聚类算法最优匹配算法具有较好的稳定性和较高的聚类准确率。  相似文献   

7.
K-means 是一种基于划分的聚类算法,由于 K-means 算法在选择初始聚类中心时是随机选取 k 个点,因此一旦 k 个点选取不合理,将会误导聚类过程,得到一个不合理的聚类结果。在分析聚类结果对初值依赖性的基础上,对初值选取方法进行了分析和研究,采取“射靶”的原理进行类中心搜索。从实验结果中可以发现,改进后 K-means 得到的聚类结果更加稳定,对初始聚类中心的依赖性减弱了。  相似文献   

8.
依据图书馆的现有信息,结合数据挖掘的流行方向,应用聚类算法分析研究读者的借阅行为,获得对图书馆管理有用的信息,提高图书馆管理工作效率和资源利用率。  相似文献   

9.
基于动态隧道系统的K-means聚类算法研究   总被引:1,自引:0,他引:1  
针对K-means聚类算法易陷入局部极小的问题,利用动态隧道算法在解决全局最优化问题中的有效性,将算法中的动态隧道过程引入到K-means聚类算法中,提出了一种基于动态隧道算法的K-means聚类算法.该算法在K-means聚类算法寻优得到的局部极小值基础上,利用动态隧道过程寻找更小的能量盆地,再将其值提交给K-means聚类算法进行迭代寻优,重复该过程,直到找到全局最小值.理论分析和仿真实验证明,该算法的聚类效果要优于K-means聚类算法.  相似文献   

10.
一种改进的K-means聚类算法   总被引:1,自引:0,他引:1  
传统的K-means聚类算法对初始聚类中心的依赖程度很大,聚类结果会随聚类中心的选择不同波动很大,为了消除这种中心选择不确定性,提出一种改进的K-means聚类算法,从而有效地改善初始聚类中心点选择的随机性,提高聚类结果的稳定性.仿真实验结果表明,改进后的K-means聚类算法优于传统的算法.  相似文献   

11.
K均值算法利用K个聚类的均值作为聚类中心,通过对比样本到各聚类中心的距离,将样本划分到距离最近的聚类中,从而实现样本的聚类.分析了K均值算法的基本原理和实现步骤,并将其应用于数据聚类和图像分割,取得了较好的聚类效果.最后,针对K均值算法的不足之处,提出了改进措施,提高了K均值算法的聚类性能.  相似文献   

12.
基于SOFM网络的改进K-均值聚类算法   总被引:1,自引:0,他引:1  
针对传统的K-均值聚类算法中随机选取初始聚类中心的缺陷,提出一种改进的K-均值聚类算法,利用自组织特征映射网络(SOFM)自动获得初始聚类中心.实验结果表明,改进的K-均值聚类算法能有效改善聚类性能,提高聚类的准确率.  相似文献   

13.
为解决传统 K-means 算法中因初始聚类中心选择不当而导致聚类结果陷入局部极值的问题, 采用蝙蝠算法搜寻 K-means 算法的初始聚类中心, 并将模拟退火的思想和基于排挤的小生境技术引入到蝙蝠算法中, 以克服原始蝙蝠算法存在后期收敛速度慢、 搜索力不强等问题。 同时, 通过测试函数验证了其有效性。 最后利用改进后的蝙蝠算法优化 K-means 算法的初始聚类中心, 并将该改进的算法与传统的 K-means 算法的聚类结果进行了对比。 实验结果表明, 改进后的算法的聚类性能比传统的 K-means 算法有很大提高。  相似文献   

14.
基于信息熵改进的 K-means 动态聚类算法   总被引:3,自引:2,他引:1  
初始聚类中心及聚类过程产生的冗余信息是影响K-means算法聚类性能的主要因素,也是阻碍该算法性能提升的主要问题.因此,提出一个改进的K-means算法.改进算法通过采用信息熵对聚类对象进行赋权来修正聚类对象间的距离函数,并利用初始聚类的赋权函数选出质量较高的初始聚类中心点;然后,为算法的终止条件设定标准阈值来减少算法迭代次数,从而减少学习时间;最后,通过删除由信息动态变化而产生的冗余信息来减少动态聚类过程中的干扰,以使算法达到更准确更高效的聚类效果.实验结果表明,当数据样本数量较多时,相比于传统的K-means算法和其他改进的K-means算法,提出的算法在准确率和执行效率上都有较大提升.  相似文献   

15.
给出了K-means算法和层次聚类算法在具体网站用户细分中准确率的比较,在细分网站用户这一类问题中,K-means算法在聚类准确率和处理速度上具有较大的优势,能够满足网站用户细分准确率的基本要求,其聚类准确率达到95%左右,且K-means算法处理速度比较快;层次聚类算法的处理速度较K-means算法慢,且其聚类准确率在处理大量用户数据时低于92%,这对于处理网站用户数据这类信息并不具备优势.  相似文献   

16.
一种确定最佳聚类数的新算法   总被引:1,自引:0,他引:1  
针对K-均值聚类算法需要事先确定聚类数K的问题,将粒度计算引入样本相似度函数,定义了新的样本相似度,用模糊等价聚类确定数据集可能的最大类簇数Kmax.以Kmax为搜索上界,利用改进全局K-均值聚类算法,以BWP(Between-Within Proportion)为聚类有效性度量指标,提出确定最佳聚类数的一种新方法.通过UCI机器学习数据库数据集以及随机生成的人工模拟数据集实验测试,证明该算法不仅能有效确定数据集的最佳聚类数,而且适用于大规模数据集,但是会受到噪音点影响.  相似文献   

17.
假设β1α1 0,β2α2 0。文章对如下定义的强奇异积分算子Q乙2f(x-t, y-s, z-γ(t)h(s))t1e+α1,γ(t), h(s)满足某些适当的条件。利用振荡积分估计,得到当β1 3α1 0且β2  相似文献   

18.
数据聚类是一个功能强大的技术,它能够把数据特征相似的对象划分为一类,但是并不是所有的聚类算法的实现都能产生相同的聚类结果;并且K均值算法的结果很大程度上依赖它的初始中心的选择;提出了一种新颖的关于K均值初始中心选择的策略;该算法是基于反向最近邻(RNN)搜索,检索一个给定的数据集,其最近的邻居是一个给定的查询点中的所有点;使用这种方法计算初始聚类中心结果发现是非常接近聚类算法所需的迭代聚类中心;对提出的算法应用到K均值聚类中给予了证明;用几种流行的数据集的实验结果表明了该算法的优点。  相似文献   

19.
针对K-均值聚类算法存在的不足,提出了一种新的整合粒子群优化算法(PSO)和K-均值算法的聚类算法.在新算法中,首先结合使用粒子群优化算法和K-均值算法搜索全局最优解的位置,然后再用K-均值算法在全局最优解附近的局部空间内快速寻找最优聚类中心.通过对4个数据集的实验测试,将此算法与K-均值算法、基于粒子群的K-均值算法进行了比较.实验结果表明,新算法的聚类质量比后两个算法更优.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号