首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
一种新的基于蚁群原理的聚类算法   总被引:1,自引:1,他引:0  
为了改善聚类分析的质量,提出一种与蚁群原理相结合的聚类方法. 首先对传统的聚类算法k-means进行改进,克服传统的k-means算法必须事先确定分类的个数k和选择聚类点的缺陷,然后将蚁群算法的转移概率引入k-means算法,对上述聚类结果进行二次优化.实验结果表明,改进的k-means与蚁群算法相结合的聚类方法比单一聚类算法更有效.  相似文献   

2.
针对传统k-means聚类算法面对海量数据存在时间复杂度急剧增加的问题,结合云计算的优势,提出基于MapReduce编程框架来实现k-means聚类算法的并行化处理。Map函数完成每个样本记录到聚类中心的距离计算并标记其所属聚类类别,Reduce函数汇总中间结果并计算出新的聚类中心,供下一轮迭代使用。通过实验表明:基于MapReduce的并行化k-means聚类算法具有较好的加速比和良好的扩展性。  相似文献   

3.
针对k-means算法必须事先指定初始聚类数k,并且对初始聚类中心点比较敏感,聚类准则函数对求解的最优聚类数评价不理想,提出一种基于局部密度的启发式生成初始聚类中心方法,在此基础上设计一种准则函数自动生成聚类数目,改进了传统k-means算法.实验表明改进的算法比传统k-means算法提高了聚类效率.  相似文献   

4.
针对传统k-means聚类方法随机选择初始聚类中心而导致的收敛速度慢、聚类效果较差的问题,本文结合空间相似度度量提出一种改进的k-means初始聚类中心选择方法.该方法通过定义空间中样本的相似度,从而选择相似度较小的样本作为初始聚类中心,以减少达到聚类稳定状态的迭代次数,提高聚类的效率.UCI数据集上的实验结果表明,与传统k-means聚类方法相比,本文提出的改进的k-means初始聚类中心选择方法能够使聚类的收敛速度加快,得到良好的聚类效果.  相似文献   

5.
针对传统k-means算法中初始聚类中心选取的随意性对于聚类结果影响较大的问题,提出了基于Leader算法的k-means改进算法——Lk-means算法.该算法有效避免了初始聚类中心选取的边缘化和随意性.实验证明,Lk-means算法的聚类结果更加有效合理.  相似文献   

6.
针对MinMax k-means算法易产生空解、 收敛速度慢和计算效率低的问题, 提出一种增量式MinMax k-means聚类算法. 该算法从给定的初始聚类个数开始, 以固定步长递增式产生新的聚类中心, 采用基于数据均衡的快速分裂方法产生增量聚类中心, 从而避免了传统增量聚类中心选择中遍历数据、k-means聚类算法运行次数过多导致的大计算量问题. 与MinMax k-means及相关算法的对比实验结果表明, 该算法在计算效率和求解精度上均优于对比算法, 有效改善了MinMax k-means聚类对初始化中心敏感和易产生空解的问题.  相似文献   

7.
针对传统聚类算法存在挖掘效率慢、 准确率低等问题, 提出一种基于最小生成树的多层次k-means聚类算法, 并应用于数据挖掘中. 先分析聚类样本的数据类型, 根据分析结果设计聚类准则函数; 再通过最小生成树对样本数据进行划分, 并选取初始聚类中心, 将样本的数据空间划分为矩形单元, 在矩形单元中对样本对象数据进行计算、 降序和选取, 得到有效的初始聚类中心, 减少数据挖掘时间. 实验结果表明, 与传统算法相比, 该算法可快速、 准确地挖掘数据, 且挖掘效率提升约50%.  相似文献   

8.
一种改进的聚类算法在入侵检测中的应用   总被引:1,自引:0,他引:1  
为了研究聚类算法在入侵检测中的应用,该文讨论了传统的k-means算法,指出其存在的问题;将遗传算法引入到聚类算法中,提出了一种改进的k-means算法。实验证明,用该算法实现的数据聚类与传统的k-means算法相比较,能有效提高数据聚类效果。  相似文献   

9.
针对高维数据下的聚类效果需要提高,提出一种基于期望最大化的k-means聚类改进算法.该算法在没有降维和破坏原有数据结构的情况下,把期望最大化算法和k-means算法相结合,用期望最大化算法选取k-means的算法的初始聚类中心.并针对高维数据提出一种新的距离算法,代替传统的距离算法.实验结果表明提出的算法的可行性,并且在处理高维数据时的有效性.  相似文献   

10.
针对传统阴阳k-means算法未利用数据结构导致计算效率较低的问题, 提出一种高效阴阳k-means聚类算法. 该算法根据数据相似性将原始数据进行逐层分解, 并建立满m叉树结构存储各层数据, 以树结构各叶子节点中存储的数据信息建立加权数据, 运行加权阴阳k-means算法得到收敛中心. 在原始数据中以加权数据收敛中心为初始化条件运行传统阴阳k-means算法进一步优化目标函数值. 在5组UCI数据集上与k-means、传统阴阳k-means及另外两种加速算法进行对比实验, 实验结果表明, 该算法具有较高的加速比, 且求解精度与传统阴阳k-means聚类基本相同.  相似文献   

11.
通过将粗糙集和模糊聚类算法相结合, 利用粗糙集中上近似集和下近似集的概念改进模糊聚类算法, 解决了模糊聚类边界不确定的问题, 得到了上近似集和下近似集的聚类结果, 从而实现更好的聚类, 改进算法可以处理边界问题和复杂数据问题. 将改进的粗糙集模糊聚类算法用于研究环糊精聚类, 并将聚类结果与K均值聚类分析算法、 模糊C均值聚类算法相比, 实验结果表明, 改进算法有较好的聚类效果.  相似文献   

12.
一种基于核的模糊聚类算法   总被引:4,自引:2,他引:4  
结合核技术与改进的模糊c均值算法聚类准则提出一 种基于核的模糊聚类算法. 通过引入核函数, 样本点被非线性变换映射到高维特征空间进行聚类, 提高了聚类性能. 同时, 算法改进了模糊c-均值聚类模型中的概率型约束条件, 使其对噪声和野值点具有较好的鲁棒性. 在真实数据和人造数据上与常用聚类算法进行了对比实验, 结果表明该算法具有较低的时间、 空间复杂度与较好的聚类性能.  相似文献   

13.
针对传统Mashup服务推荐在网络构建方式的成本和计算复杂性过高问题, 提出一种基于半监督层次聚类描述的Mashup服务推荐算法. 首先, 利用网爬工具收集ProgrammableWeb上的Mashup服务信息, 并采用后缀剥离算法把Mashup服务的标签信息修改为名词形式, 以此作为研究分析的数据集; 其次, 为提高聚类精度, 提出一种半监督层次描述聚类算法, 通过植入层次聚类算法顶层核心集方式, 有效解决了传统层次描述聚类因顶层分类集构造失败而影响Mashup服务推荐算法的准确度. 通过在聚类数据集和网爬Mashup服务数据库上的实验表明, 该算法的Mashup服务推荐准确率优于对比算法.  相似文献   

14.
基于粒子群优化和SOM网络的聚类算法研究   总被引:2,自引:0,他引:2  
利用改进的粒子群优化算法(PSO)的优化性能,结合SOM网络模型,提出了一种基于粒子群优化算法和SOM网络的聚类算法(PSO/SOM),使用PSO对SOM网络进行训练来代替SOM的启发式训练方法.将PSO/SOM算法用于对Wine和Iris等数据集进行模式聚类识别,可以得到较优的聚类识别效果.相比标准SOM算法能有效提高网络映射的准确程度,降低网络的量化误差和拓扑误差,同时也降低了错聚率,实验结果验证了本算法的有效性.  相似文献   

15.
采用聚类神经网络与分离输出语音重构的语音分离算法   总被引:1,自引:1,他引:0  
基于听觉现象分析计算模型 ( CASA)的基本原理 ,对仅有单通道输入混合语音信号时 ,采用振荡器神经网络 ,提出了一种 CASA计算模型语音分离算法结构 .利用实例说明了算法的具体实现步骤和参数设置 .讨论了该算法结构中各语音听觉感知成分 Segments的聚类过程和对分离输出语音的重构处理部分 ,以及如何采用合适的听觉感知成分聚类规则设计相应的聚类神经网络 ,以完成对应不同输入独立语音源信号的各 Segments的聚类 ,从而实现语音分离任务  相似文献   

16.
通过将类间分离度函数引入到模糊C-均值聚类算法中,结合半监督的思想,建立基于信息熵的半监督模糊C-均值聚类模型,并对该模型的求解过程进行推导,提出一种新的算法.为了验证算法的有效性,将该算法在UCI数据集上进行实验,实验结果表明,该算法比仅引入信息熵的模糊C-均值聚类方法聚类性能更好.  相似文献   

17.
针对半监督聚类算法中监督信息使用不充分,监督信息中信息含有量低的问题,提出一种结合主动学习的半监督聚类算法.首先结合使用数据的类别标记和成对约束信息,指导Kmeans聚类过程,设计出一种基于Seeds集和成对约束的半监督聚类算法SC-Kmeans;其次将主动学习算法引入到SC-Kmeans中,以尽量小的代价选取信息含有量更高的监督信息,提高SC-Kmeans算法的聚类精度;最后在UCI标准数据集上进行仿真实验.实验结果表明,该算法取得了较好的聚类效果,有效提高了聚类准确率.  相似文献   

18.
在研究了基本聚类模型的基础上,模拟蚂蚁寻找食物源的行为,提出了一种基于蚁群最优化的自适应聚类分析的新方法。与之前的蚁群聚类不同,引入交换机制增强蚁群的觅食能力以提高聚类性能。该算法可以不用预先输入聚类数目,在仿真实验中该方法获得了比GCA算法和Kmeans算法更好的表现,表明这种基于交换机制的聚类算法具有较好的聚类性能。  相似文献   

19.
先通过数据约简技术在不损失数据聚类结构的前提下对数据进行精简, 利用提出的近似模糊c均值聚类算法对精简后数据进行划分得到初始化中心, 再在该中心基础上通过模糊c均值聚类算法结合聚类有效性指标, 实现对数据的无监督聚类, 改进了无监督模糊c均值聚类算法聚类性能过分依赖初始化中心及大数据集下计算效率不理想的问题. 与已有算法的对比实验表明, 所提出的算法具有更高的求解精度与计算效率, 得到的聚类个数更合理.  相似文献   

20.
为数据集选择合适的聚类算法是获得高质量聚类结果的前提和保障.提出了基于有效性指标的聚类算法选择方法,通过对不同聚类算法的聚类结果的质量评价为数据集选择最适合的聚类算法.该方法的优点是在对数据集的情况了解甚少的情况下,也能有效地保障聚类质量.实验结果表明本文方法十分有效,为实验数据集正确选择出最适合的聚类算法,并获得了高质量的聚类结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号