首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
聚类分析是模式识别的一个重要分支,以核心点和k-均值算法为基础,提出了一种基于参考点的快速k-均值算法;本算法以参考点作为第一个初始聚类中心,剩余初始聚类中心在核心点中选取,使得初始聚类中心能更好的反映模式样本集的几何特征,并且能减少迭代次数.  相似文献   

2.
针对aiNet算法中没有定义目标函数、记忆网络动态无规律变化等问题,提出了基于目标进化的人工免疫网络聚类新算法,将人工免疫网络压缩聚类抽象为多目标规划问题,定义了记忆网络的整体进化目标,并采用疫苗注射策略提升免疫学习质量.中心聚类和非线性聚类的仿真结果表明:新算法的聚类质量、压缩质量、参数敏感性等优于原aiNet算法;新算法的平均类散布矩阵迹为4.1420,低于原aiNet的4.2575;样本压缩率比原aiNet算法高8.42%;聚类正确率对压缩阈值的敏感性比原aiNet算法弱.  相似文献   

3.
针对红斑鳞状皮肤病鉴别诊断难题,提出利用聚类分析进行诊断;采用3种k-均值、2种k-中心点、最小生成树以及密度峰值点快速搜索聚类算法对该疾病数据进行分析,比较各算法对该疾病的聚类误差平方和、聚类结果 Rand指数、Jaccard系数、调整Rand指数以及聚类准确率;比较各算法对预处理的数据子集的聚类结果与文献中采用k-均值算法对未预处理的该数据子集的聚类结果。结果表明:邻域k-中心点算法对红斑鳞状皮肤病有很好的聚类效果,聚类准确率、聚类结果 Rand指数、Jaccard系数、调整Rand指数均优于对比算法,密度全局k-均值算法的聚类效果次之,全局k-均值算法取得最佳聚类误差平方和;k-均值算法对预处理数据子集的聚类准确率最高,邻域k-中心点与密度全局k-均值算法的聚类准确率相等;数据预处理可提高k-均值算法对该疾病的诊断准确率。  相似文献   

4.
针对代理渠道发展的新用户质量良莠不齐,将聚类算法引入新发展用户质量分析中,构建虚开用户模型识别代理商虚开用户.同时,还提出了k-均值聚类的改进算法.该算法结合数据样本分布以及所在区域的密度选取初始聚类中心,用于消除传统k-均值算法对初始聚类中心的敏感性.该算法应用于新发展用户的质量分析上,在虚开用户分析方面取得了良好的效果.  相似文献   

5.
一种改进的k-means聚类算法在入侵检测中的应用   总被引:4,自引:0,他引:4  
讨论了经典的k-平均聚类算法,说明了它存在不能很好地处理符号数据和对噪声与孤立点数据敏感等不足,提出了一种改进的k-平均聚类算法,克服了k-平均聚类算法的缺点,并从理论上分析了该算法的复杂度。实验证明,用该方法实现的数据聚类与传统的基于平均值的方法相比较,能有效提高数据聚类效果以及入侵检测的准确度。  相似文献   

6.
针对海量数据聚类过程中,经典的K-均值聚类算法对其K个初始聚类中心点的选择以及数据集噪声十分敏感的问题,提出了一种针对海量数据考虑初始聚类中心点选择的聚类算法.该算法首先采用冒泡排序法对数据集进行排序,获取数据集的各维中心值组成第一个初始聚类中心点.其次,通过计算与第一个初始聚类中心点的欧式距离,对剩余候选初始聚类中心点进行优化选择,保证所有的聚类中心点均匀地分布在数据集密度较大的空间上,以此减少聚类过程中的迭代次数和提高聚类算法效率.最后,基于UCI(University of California,Irvine)中多个数据集,进行聚类算法对比实验.结果表明,在不降低聚类效果的前提下,该聚类算法的迭代次数平均降低到50%,所需的时间降低平均达10%,由实验结果还能推出,当点集的数目越多时,该算法就能表现出越明显的聚类优势效果.  相似文献   

7.
文章提出了一种基于有限资源人工免疫系统的K-中心点聚类算法,把K-中心点聚类算法生成的簇看作有限资源人工免疫系统(RLAIS)中的人工识别球(ARB),通过免疫学习获得全局最优解。该算法是可行的、有效的。  相似文献   

8.
为了挖掘漏洞内在联系且高效管理漏洞信息,将文本处理和聚类算法应用于漏洞挖掘中.从漏洞库宏观角度出发,提出了一种基于文本挖掘和粒子群优化算法的漏洞信息聚类(PSO-Kmeans)算法.首先,通过文本处理,获取频词空间,用以将漏洞信息描述字段编码化;其次,为了减少局部最优和聚类中心选取不当对聚类结果的影响,利用粒子群优化算法获取全局聚类中心;最后,利用K-means算法实现漏洞信息的聚类,对漏洞信息进行分类别管理,并为预测未知漏洞特征提供参考.实验结果表明,PSO-K-means算法准确率达到90.16%,与K-means算法相比,其平均准确率提高约5%,平均迭代次数减少约45次.所提算法可预测3种未知漏洞的主要类别,是一种有效的漏洞分析方法.  相似文献   

9.
改进的k-均值算法在聚类分析中的应用   总被引:1,自引:0,他引:1  
介绍了在聚类中广泛应用的经典k-均值算法,并针对其易受随机选择初始聚类中心和孤立点的影响的不足,给出了改进的k-均值算法。首先使用距离法移除孤立点,然后采用邻近吸收法对初始聚类中心的选择进行了改进。并做了改进前后的对比实验和应用。结果表明,改进后的算法比较稳定、准确,受孤立点和随机选择初始聚类中心的影响也有所降低。  相似文献   

10.
为解决k-means聚类算法和k-凝聚聚类算法对于非凸形状数据聚类正确率低和模糊核聚类算法(FKCM)收敛速度慢的问题,将k-凝聚聚类算法与核函数方法相结合,在高维特征空间构造了新的核聚类算法--核k-凝聚聚类算法,实现了k-凝聚聚类算法的核化.通过Matlab编程进行数值实验,证明了核k-凝聚聚类算法在聚类的准确性、稳定性、健壮性等方面较之k-means聚类算法、k-凝聚聚类算法和FKCM有一定程度的改进.  相似文献   

11.
针对MinMax k-means算法易产生空解、 收敛速度慢和计算效率低的问题, 提出一种增量式MinMax k-means聚类算法. 该算法从给定的初始聚类个数开始, 以固定步长递增式产生新的聚类中心, 采用基于数据均衡的快速分裂方法产生增量聚类中心, 从而避免了传统增量聚类中心选择中遍历数据、k-means聚类算法运行次数过多导致的大计算量问题. 与MinMax k-means及相关算法的对比实验结果表明, 该算法在计算效率和求解精度上均优于对比算法, 有效改善了MinMax k-means聚类对初始化中心敏感和易产生空解的问题.  相似文献   

12.
The k-means clustering algorithm is one of the most commonly used algorithms for clustering analysis. The traditional k-means algorithm is, however, inefficient while working on large numbers of data sets and improving the algorithm efficiency remains a problem. This paper focuses on the efficiency issues of cluster algorithms. A refined initial cluster centers method is designed to reduce the number of iterative procedures in the algorithm. A parallel k-means algorithm is also studied for the problem of the operation limitation of a single processor machine when given huge data sets. The analytical results demonstrate that these improvements can greatly enhance the efficiency of the k-means algorithm, i.e., allow the grouping of a large number of data sets more accurately and more quickly. The analysis has theoretical and practical importance for work on the improvement and parallelism of cluster algorithms.  相似文献   

13.
针对单一声学特征和k-means算法在说话人聚类技术中的局限性,为了更好地表达说话人的个性信息并提高说话人聚类的准确率,将特征融合和AE-SOM神经网络应用于说话人聚类中,提出一种改进的说话人聚类算法.该算法通过对语音信号特征分析,将MFCC特征参数和LPCC特征参数相结合,从而完善说话人的个性信息.并在k-means...  相似文献   

14.
传统-means聚类算法的性能依赖于初始聚类中心的选择.本文将复杂网络节点的属性值作为节点的度、聚集度与聚集系数的加权值,通过计算所有节点的加权综合聚集特征值,选取综合聚集特征值高,并且彼此之间无高聚集性特征的K个节点作为聚类的初始聚类中心,然后进行聚类迭代过程.实验结果表明,新算法对初始聚类中心的选取更迅速有效,避免了传统K-means算法初始聚类节点选取的敏感性,进而提高K-means算法的聚类质量.  相似文献   

15.
基于改进聚类算法的RBF网络及其应用   总被引:1,自引:0,他引:1  
RBF网络可以逼近任意连续非线性函数,且训练速度快,性能好,被广泛应用于过程建模和预测。RBF网络的一个重要因素是隐层节点的选择,隐层节点过多或过少都会影响最终网络的性能。提出一种改进的k-means聚类算法,可以自动确定最优的聚类区数,并且可使最终的聚类中心合理地分布在数据空间中。在应用RBF网络进行建模和预测时,采用该方法确定隐层节点的中心,跟用通常的聚类方法相比,可以大大减小网络规模。仿真和实际应用结果都证明该方法的有效性。  相似文献   

16.
针对k-means算法必须事先指定初始聚类数k,并且对初始聚类中心点比较敏感,聚类准则函数对求解的最优聚类数评价不理想,提出一种基于局部密度的启发式生成初始聚类中心方法,在此基础上设计一种准则函数自动生成聚类数目,改进了传统k-means算法.实验表明改进的算法比传统k-means算法提高了聚类效率.  相似文献   

17.
为了解决传统K均值算法在处理大规模数据时的局限性,在近似K均值算法(AKM)基础之上,利用对聚类中心进行分类的思想,提出了快速近似K均值算法(FAKM).该算法舍去了在AKM聚类结果中只获得少数样本的聚类中心,并充分利用类内样本密集稳定的聚类中心,使得迭代过程中待聚类样本数和类别数逐步减少,达到了提高算法速度及精简聚类结果的目的.将FAKM算法运用于实际的图像检索系统中,实验结果表明,系统在检索准确率、检索时间和聚类时间方面都得到了很好的改善.  相似文献   

18.
针对全局K-means聚类算法和快速全局K-means聚类算法在选择下一簇的聚类中心点时,需要逐一计算数据集中每个点作为备选聚类中心点时的簇内平方误差函数,而数据集中存在很多不可能作为备选点的噪声点.为剔除噪声点,提出了一种基于高密度数的DGK-means算法,并通过UCI数据库中的4组数据集进行实验测试.验证了在聚类效果稳定的前提下,改进的DGK-means算法比全局K-means算法和快速全局K-means算法,聚类用时更短,聚类效率更高.  相似文献   

19.
研究了免疫检测器的生成机制,通过采用k平均聚类算法提取到的规则生成未成熟检测器,提出了将模糊逻辑理论运用到成熟检测器激活及记忆检测器生成的进化方法,改进了传统的以人工免疫为基础的入侵检测系统中随机生成未成熟检测器的算法.实验表明该方法能够提高检测器的检测性能,证实了该算法的有效性.  相似文献   

20.
人工免疫C-均值聚类算法   总被引:13,自引:0,他引:13  
通过借鉴生物免疫系统中的克隆选择原理和记忆机制,提出了一种人工免疫C-均值混合聚类算法.该算法采用了新的克隆选择方法,通过亲和度排序和个体浓度定义了个体的选择概率,从而可确定个体的适应值评价函数,以评价和选择个体.算法还集成了一种C-均值搜索算子,用于加快收敛速度.在聚类数目已知的情况下,所提算法能够得到给定数据集下的全局最优划分,与基于遗传算法的聚类方法比较,它具有更快的收敛速度和更高的收敛精度,并可扩展到性能指标能够表示为优化聚类中心函数的聚类模型之中.仿真结果表明,所提算法是有效性的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号