首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
基于分层聚类的k-means算法   总被引:8,自引:0,他引:8  
为了更好地实现聚类,在分析分层聚类和k-means算法优缺点的基础上提出了一种改进的聚类算法.改进算法将分层聚类和k-means聚类算法的优点相结合,首先采用分层聚类,得到一个初始的聚类结果,然后应用k-means聚类算法继续聚类.实验结果表明,改进算法较原先传统的聚类算法,不但算法执行速度快、效率高,而且聚类效果也比较好。  相似文献   

2.
图形聚类算法的代谢网络模块化分析   总被引:1,自引:0,他引:1  
代谢网络的研究是当今生物学研究中的新热点,使用图形聚类算法对代谢网络进行分析研究是一个有力的手段.文中提出了用图形聚类方法挖掘复杂代谢网络中蕴含的功能信息并进行模块相似性分析的方法,从系统生物学角度揭示光合作用的进化.介绍了马尔可夫聚类算法和模拟退火聚类算法两种图形聚类方法;给出了两种方法对叶绿体和蓝细菌的代谢网络进行聚类的结果;定义了模块相似度评价指标,挖掘叶绿体和蓝细菌间保守的功能模块,并对其网络结构进行了比较分析.  相似文献   

3.
Web日志模糊聚类算法的研究   总被引:3,自引:0,他引:3  
本文提出了一种新的Web事务模糊聚类算法.给出了新的Web事务定义和相异度定义,聚类准则函数是所有样本与C个代表中心的相异度之和,我们的目标是使这个聚类准则函数最小.同时给出了改进算法.经过试验证明,改进的算法更有效.  相似文献   

4.
为了提高银行客户分类的正确率,使银行的收益最大化,提出一种基于改进K均值聚类的银行客户分类算法.算法定义了类间最大相似度均值(AMS),并根据该定义确定最佳聚类数.当计算出的当下AMS值比前一次的AMS值小时,根据距离原则选择初始聚类中心;当计算出的当下AMS值比前一次的AMS值大时,把该最小AMS值相匹配的聚类中心看作初始聚类中心.利用最佳聚类数和初始聚类中心实现银行客户的细分.仿真结果表明,提出的算法能够跳出局部最优,并提高客户分类的正确率.  相似文献   

5.
DBSCAN算法是一种基于密度的空间数据聚类方法,聚类速度快,且能够有效处理噪声点和发现任意形状的空间聚类.但是数据量大时要求较大的内存支持和IO消耗,当空间聚类的密度不均匀,聚类间距离相差很大时,聚类质量较差.本文在DBSCAN算法的基础上提出一个划分不同密度分别聚类的算法.测试结果表明可以改善聚类效果.  相似文献   

6.
聚类是将物理或抽象对象的集合组成为由类似的对象组成的多个类的过程,是研究数据间逻辑上或物理上的相互关系的技术,是数据挖掘技术中的重要组成部分。结合国内研究现状,论文介绍各类主要的聚类算法及其应用领域。  相似文献   

7.
针对K-均值算法易受孤立点影响、对初始中心点选择敏感、易陷入局部最优的问题,对K-均值算法进行了改进,提出了一种自适应优化选择初始中心点的K-均值算法。实验结果表明,改进后的算法不仅较大程度上弥补了传统K-均值算法的不足,并且提高了聚类的稳定性和准确率。  相似文献   

8.
为了在动态环境中快速地跟踪变化后的最优解集,提出一种基于聚类预测模型的动态多目标优化算法.通过对种群聚类,提高预测解集的分布性与广泛性,为分段预测做准备,然后利用历史信息对每个子类的中心点和形状进行预测,在环境变化后,预测产生的每个子类共同构成整个新的初始种群,有引导性地增加了种群的多样性,使算法能快速跟踪新的最优解集.在标准动态测试问题上进行算法测试,实验结果表明所提算法能快速地适应环境的动态变化,所获解集具有较好的收敛性和分布性.  相似文献   

9.
为自动提取CT肺部肿瘤,辅助医生对患病部位进行诊断和治疗,利用K均值聚类算法自动提取肺部肿瘤和剩余肺部图像,并分别和影像医生手工分割的肺部肿瘤和剩余肺部图像作对比。结果表明,自动提取的肺部肿瘤图像与专业医学影像医生手工提取的肺部肿瘤图像在外形、灰度和方差方面非常接近,说明利用K均值聚类算法自动提取肺部肿瘤的方法是有效的、可行的。  相似文献   

10.
大规模高维数据集的聚类算法已成为当前聚类研究的热点,由于高维的原因,聚类往往隐藏在数据空间的某些子空间中,传统的聚类算法无法获得有意义的聚类结果.此外,高维数据中含有的大量的随机噪声也会带来额外的效率问题.为了解决以上问题,该文在CLIQUE算法的基础上提出了一种基于最优区间分割和数据集划分的聚类算法—OpCluster,并使用仿真数据对该算法加以验证,实验结果表明,OpCluster对大规模高维数据集具有很好的聚类效果.  相似文献   

11.
近几年来,单元化制造系统(CMS)作为一种由于能满足不同客户需求、缩短产品生产周期、提高企业的全球竞争力的先进制造组织模式而备受关注。本文提出了一种新的矩阵聚类方法(HERBAL)设计制造单元,并探讨了该方法与其它聚类方法如ROC、ROC2、DCA等方法在成组效率、成组功效等评价指标上的优劣,证明了该方法的可行性和高效率。同时该方法中的设备_零件矩阵(MCM)中的二元值元素,采用反映实际生产中的流程时间替代,可使聚类结果更符合实际的生产需求。  相似文献   

12.
聚类分析算法研究   总被引:1,自引:0,他引:1  
聚类分析是数据挖掘的重要的组成部分,已经广泛应用于模式识别、电子商务、图像处理等领域。本文对几种主要的聚类及孤立点检测方法进行了分析研究,介绍了各种聚类方法的优缺点,并对聚类研究进行了总结。  相似文献   

13.
基于免疫聚类和遗传算法的RBF网络设计方法   总被引:7,自引:0,他引:7  
基于人工免疫机制和遗传算法,提出了一种训练径向基函数(RBF)网络的混合算法.该算法采用了一种可以实现数据聚类的人工免疫机制根据输入数据集合自适应地确定RBF网络隐层中心的数量和初始位置;采用遗传算法训练RBF网络,能够使优化过程趋于全局最优.将该方法用于多用户检测问题的实验结果表明,采用这种混合算法训练的RBF网络结构精简,具有很好的抗多址干扰的性能.  相似文献   

14.
提出一种基于模糊聚类的可解释性建模方法.利用提出的一种含有熵的聚类有效性函数来评价模糊聚类方法的有效性和可解释性,从而确定模糊规则数和模型前提参数,然后利用最小二乘法来辨识模型的结论参数,最后采用梯度下降法来调整模型的参数.该方法应用于Box-Jenkins 数据仿真实例,仿真结果表明该方法不但能保证系统的精确性,还具有很高的可解释性.  相似文献   

15.
鉴于网络入侵检测数据样本特征属性的异构性及贡献率不同,提出一种加权特征的异构数据相似性度量法来反应网络数据样本间的相似程度.针对基于模糊C-均值聚类的网络入侵检测算法聚类数目难以确定的问题,提出了一种自动确定最佳聚类数的无监督模糊聚类入侵检测算法.通过KDDcup1999数据集的仿真对比实验,结果表明本文算法能找到最佳...  相似文献   

16.
懒散关联分类针对每个待分类实例的特征进行分类关联规则的挖掘,通常能取得较高的准确率。然而,由于某些数据集中存在一些质量不好的特征,将影响懒散关联分类的准确率。此外,分类耗时较长是懒散关联分类另一个缺点。针对上述问题,提出了一种基于信息熵的懒散关联分类算法。该算法以信息熵度量属性值的质量,仅选取每个待分类实例中最好的k个属性值,将得到规模较小且与待分类实例紧密相关的训练子集,从中高效挖掘到高质量的规则。实验表明,与懒散关联分类相比,基于信息熵的懒散关联分类方法提高了分类准确率,并极大减少了运行时间。  相似文献   

17.
提出了一种基于语义的Ontology相似性计算方法,该方法不仅考虑概念本身的相似性,还考虑了属性集合和相关概念集合的相似性,通过概念基本相似性极限控制属性集合相似性计算的范围,通过语义半径控制相关概念的范围.以基于语义的Ontology相似性方法计算Ontology聚类的相似性矩阵,采用凝聚层次聚类算法实现Ontology聚类.实验表明:基于语义的Ontology聚类能够获得满意的效果,在性能上优于使用oMAP相似性方法的Ontology聚类.  相似文献   

18.
一种基于结构信息总结树的XML文档聚类方法   总被引:2,自引:0,他引:2  
提出一种有效的XML文档结构信息表达方法,用数字化的结构总结树SST对XML文档的结构信息进行编码,在此基础上给出结构距离的定义,并采用遗传算法对XML文档进行聚类.实验证明该方法分类准确率高,易于实现,且不需先验的DTD知识.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号