首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
一种新的混合聚类算法   总被引:3,自引:2,他引:3  
聚类是数据挖掘的主要技术之一,是一种无导师监督的模式识别方式。聚类分析就是按照数据间的相似程度,依据特定的准则将数据划分成不同子类。K-平均算法是经典的聚类算法。蚂蚁聚类算法是近来涌现的新的聚类算法,它通过模拟蚁群的智能行为进行聚类分析,已经在数据挖掘中得到应用。通过分析蚂蚁聚类算法和K-平均算法两种不同聚类算法的基本思想,将两种算法结合得到混合聚类算法,仿真实验证明混合聚类算法的算法性能优于蚂蚁算法和K-平均算法。  相似文献   

2.
一种基于修正划分模糊度的聚类有效性函数   总被引:4,自引:0,他引:4  
针对大多数现有的聚类有效性函数都是针对于数值型数据提出的,无法有效地评价和分析类属型数据的问题,提出了一种新的聚类有效性函数—修正划分模糊度;通过结合模糊划分熵和划分模糊度测度,所提出的聚类有效性函数既可以评价数值型数据分类结果,也可以评价类属型数据的分类性能。实验结果表明了这一新的聚类有效性函数的合理性  相似文献   

3.
粗糙核k-means聚类算法   总被引:1,自引:0,他引:1  
通过研究核聚类算法,以及粗糙集,提出了一个新的用于聚类分析的粗糙核聚类方法。通过mercer核映射把输入空间中的样本映射到Hilbert空间,使样本空间中没有显现的特征在特征空间中突现出来,在这种样本差异加大的基础上,结合粗糙集的思想,把样本分别划到相应聚类中心的上、下近似中,上、下近似中的样本按照一定的比例来共同决定新的聚类中心。这样不但聚类精度大大提高,而且算法收敛速度也较快。仿真实验的结果表明该算法的可行性和有效性。  相似文献   

4.
基于二维信息的传统聚类方法并不适用于处理面板数据, 在考察面板数据多重信息特征的基础上, 基于面板数据的"绝对指标", "增量指标"及"波动指标", 重构了面板数据相似性测度的距离函数和Ward聚类算法, 提出了面板数据自适应权重聚类方法. 所提供的算法既可退化为传统的绝对量距离聚类方法, 亦可对面板数据的未来所属类别进行聚类预测. 最后, 实例显示此方法兼具有效性和灵活性.  相似文献   

5.
基于加权k-均值聚类与粒子群优化的多航迹规划   总被引:1,自引:0,他引:1  
针对复杂环境下的无人机多航迹规划问题,提出了将粒子群优化(particle swarm optimization, PSO)算法与加权k-均值聚类算法相结合的规划方法。每个粒子表示一条航迹,采用加权k-均值聚类算法对粒子进行分类,得到多个粒子子群,在每个子群内部进行一条可行航迹的优化,最终得到多条不同的可行航迹。对传统k-均值聚类算法进行改进,采用排挤机制产生初始聚类中心,针对实际环境中突发威胁的分布不均性,在聚类过程中,对航迹节点按照所在区域突发威胁的出现概率进行加权,提出了加权k-均值聚类算法。仿真实验表明,所提出的方法能够有效地得到无人机的多条可行航迹。  相似文献   

6.
实体解析问题是数据挖掘数据清理过程中的基本问题.异质网络数据的大量涌现,要求能够针对包含多种类型对象的数据同时进行实体解析.针对包含两种对象的实体解析问题,提出了一种基于联合聚类思想的协同实体解析算法.将两种对象分为决定对象和辅助对象,提出了一个基于联合聚类思想的两阶段协同实体解析框架,能够同时获得决定对象和辅助对象的各自聚类结果,其中每一个类包含的若干实体参考表示是对现实世界中同一实体的共同引用.最后对提出的算法进行了数值实验.  相似文献   

7.
针对战训数据丰富, 数据背后空战决策知识贫乏的问题, 提出了一种空战决策知识构建方法。首先, 根据空战决策影响因素来分析决策知识的生成过程, 选择用产生式规则来表示空战决策知识。其次, 针对战训数据存在噪声数据干扰以及连续属性数据难以满足数据挖掘算法离散度量要求的问题, 应用了k-means聚类算法来检测离群点并使用最小描述长度准则算法将连续属性离散化。最后, 基于预处理后数据, 采用粗糙集提取空战最小决策规则知识, 通过构建模糊逻辑推理系统实现空战决策知识的推理与应用。仿真表明, 该方法能够有效地提取空战决策规则知识以及知识的推理与应用。  相似文献   

8.
1 .INTRODUCTIONWith the rapid development of computer and commu-nicationtechnologies ,thereis a tendency of sharpin-creasing of multi media information. Due to theircharacters of large quantity and difficulty in descrip-tion,it’s very difficult tofind users’neededinforma-tion accurately and quickly in the sea of multi mediainformation. Thus ,howto organize and index largemulti media information to support efficient retrievalbecomes the most urgent issue . I mage , which is asi mple medi…  相似文献   

9.
提出了改进的核子类判决分析(improved kernel clustering based discriminant analysis, IKCDA)方法,首先采用快速全局核k 均值聚类算法找到每类目标的最优子类划分,然后基于找到的子类划分结果采用核子类判决分析求取最优的投影矢量。基于UCI机器学习数据库的实验结果表明,经过IKCDA特征提取后异类样本间的可分性明显改善了。此外,基于美国运动和静止目标获取与识别(moving and stationary target acquisition and recognition, MSTAR)计划录取的合成孔径雷达地面静止目标数据的实验结果表明,经过IKCDA后可以改善对真实目标的分类性能和对干扰目标的拒判能力。  相似文献   

10.
部分最小二乘回归(PLS)可较好地解决变量间的共线性问题,目前被广泛地应用于过程建模和监控.本文将递推PLS(RPLS)算法同RBF网络相结合,给出了一种非线性递推PLS方法(NRPLS),可根据在线数据自适应地调整模型结构和参数,使模型适应非线性过程的变化.在确定RBF网络的隐层节点参数时,采用了一种改进的k-means聚类算法,自动确定最优的聚类区数.该递推算法用于聚丙稀熔融指数软测量模型的在线修正,取得了较好的效果.  相似文献   

11.
针对传统聚类方法在处理复杂电磁环境下的雷达信号时存在的聚类质量低、参数需要人为设置、易受孤立噪声脉冲干扰等问题, 提出一种基于数据场联合决策图改进的高斯混合模型(Gaussian mixture model, GMM)聚类算法。将数据场理论应用于数据对象密集程度的表征, 生成势能距离决策图, 进而自动实现聚类数目和中心点的选择, 最后结合GMM聚类实现对数据对象的聚类划分。仿真实验结果表明, 在脉冲到达角、脉宽、载频等参数存在较大抖动, 测量误差以及存在孤立噪声脉冲干扰和脉冲丢失时, 本文方法相较于现有典型分类方法具有更好的分选效果。  相似文献   

12.
基于遗传算法的动态聚类方法   总被引:4,自引:0,他引:4  
针对常规动态聚类方法对初始聚类中心的敏感性以及聚类结果与样本输入次序有关等问题,本文另辟蹊径,提出了一种基于GA 的动态聚类方法,并将它应用到数据库的数据分析中. 计算结果表明,该方法是一个具有全局最优解的动态聚类方法,其结果明显好于K-均值聚类算法.  相似文献   

13.
由于数据流具有快速、无限、突发等特性,实现高速网络下的实时入侵检测已成为一个难题。设计一种维持数据流概要特征的相似搜索聚类树(similarity search cluster-tree, SSC-tree)结构,在此基础上提出一种基于SSC-tree的流聚类算法用于高速网络的入侵检测。为适应高速、突发到达的数据流,算法采用了链式缓存、捎带处理和局部聚类策略。SSC-tree中的链式缓存区用于临时存放数据流突发时算法不能及时处理的数据对象,缓冲区中的内容随后被捎带处理。在高速数据流未插入SSC-tree参与全局聚类之前,利用局部聚类产生微簇来适应高速流的到达。实验结果表明,该算法具有良好的适用性,能够在高速网络环境下产生较好的聚类精度,有效实现高速网络环境下的入侵检测。  相似文献   

14.
一种基于量子机制的分类属性数据模糊聚类算法   总被引:3,自引:0,他引:3  
分类属性数据的样本间的分布不平衡、样本的分布与空间距离无关的特点与量子力学中粒子的分布状态由能量决定、粒子分布具有不平衡性的特点相似.基于此,参照量子聚类QC算法确定聚类中心的聚类策略,重写距离量子势能公式,定义相似性度量测度和相异性度量测度的新概念,提出了针对分类属性数据的量子聚类CQC算法,并对算法的聚类有效性进行了研究,通过同其它几个已有的算法的仿真实验比较,证明该算法是有效的、有一定的可扩展性,算法的一些性能优于已有的其它几个算法.  相似文献   

15.
基于多维伪F统计量的基因表达动态聚类分析方法研究   总被引:2,自引:1,他引:2  
K-均值聚类分析算法是一种广泛应用于基因表达数据聚类分析中的迭代变换算法,它通过指定类别数K-基于给定的聚类目标函数,并采用迭代更新的方法,使得最终的聚类结果的目标函数值为极小值,达到较优的聚类效果。针对K-均值聚类分析算法存在参数依赖性强,且在整个聚类过程中类的数目无法改变的缺点,引入动态调整聚类个数的思想和多维伪F统计量,提出了一种基于多维伪F统计量的基因表迭动态K-均值聚类算法。实验结果表明该算法可以动态调整聚类个数,给出最佳聚类数目,从而获得较好的聚类质量.  相似文献   

16.
近年来我国石油产量跟不上需求,供需矛盾进一步凸显,导致石油的对外依存度已经连续几年超过警戒线,为了缓解供需矛盾,石油的增储上产是一种有效措施,但精确地识别石油储层成为增储上产的一大难题,而特征选择是精确识别石油储层的有效保障.本文提出了一种增强型自适应差分演化算法,即ESADE算法,在算法中使用了双种群的概念,构造了一个简单的双层差分演化,并且在算法的选择操作中加入模拟退火的思想;接着将ESADE算法作为特征选择的搜索策略,将ReliefF算法、BIF算法、FCBF算法及随机抽选特征算法作为评价准则库,SOM神经网络算法、模糊C均值算法、K均值算法和K近邻算法作为分类器库,得到了一种基于ESADE的特征选择算法.然后将此算法应用于某油田oil81、oil82、oil83、oil84和oil85五口井的测井数据集上进行石油储层的油层、差油层、水层和干层的分类识别,并与未进行特征选择直接进行分类的结果进行比较及相同分类正确率下不同分类算法组合及不同属性选择的比较.实验结果表明与SOM神经网络算法、模糊C均值算法、K均值算法及K近邻算法这四种分类算法相比,基于ESADE的特征选择算法能在利用较少属性的同时提高分类准确率,并能够提供不同的属性和分类算法的最优组合方案.  相似文献   

17.
基于属性加权的模糊K-Modes聚类算法   总被引:6,自引:3,他引:6  
提出了一种基于属性加权的模糊K Modes算法。该算法假定不同属性对聚类结果有不同程度的影响 ,定义新的适应度函数 ,利用进化策略优化加权矩阵 ,以基于划分相似度的聚类精确度作为聚类结果的评价准则。实验表明 ,此算法具有较好的聚类效果 ,且属性加权矩阵反映了数据各个属性的重要程度 ,从而可以进行属性的提取和选择。  相似文献   

18.
基于遗传优化的采样模糊C均值聚类算法   总被引:14,自引:0,他引:14  
在数据挖掘领域,模糊C均值聚类法(FCM)在处理小量低维的数据挖掘时是有效的,但是面向数据库的数据挖掘经常要处理大量、高维的数据.在这种情况下,FCM算法在时间性能上难以令人满意.本文基于采样技术对FCM算法进行改进,以提高算法的时间性能,并利用遗传算法对聚类结果进行优化以保证聚类的质量,给出了一种新的基于遗传优化的采样模糊C均值聚类算法SFGO(SamplingFCMwithGeneticOptimization).仿真实验证明SFGO算法在大规模数据库的聚类挖掘中,在时间性能和聚类质量上都能获得较满意的结果.  相似文献   

19.
高维数据聚类是数据挖掘领域的重要研究课题,大规模高维数据聚类研究非常具有挑战性.针对高效的CABOSFV高维数据聚类算法,采用并行计算模式提高其大规模数据的处理能力,提出基于稀疏指数排序的高维数据并行聚类算法P-CABOSFV.该算法根据高维数据稀疏指数排序进行分割点选择实现数据划分,将数据分配到多个计算节点同时处理聚类任务,再基于集合稀疏特征差异度聚类结果合并策略将各计算节点的聚类结果合并得到最终聚类结果.UCI数据集和计算机合成数据集实验表明:高维数据并行聚类算法P-CABOSFV聚类质量良好,具有很强的数据规模和数据维度可扩展性,是有效可行的.  相似文献   

20.
基于模糊粗糙k-均值的用户访问模式的聚类   总被引:1,自引:2,他引:1  
Web用户访问过的网页以及在该网页上的浏览时间体现了用户的访问兴趣.为了更好的衡量任意两个用户访问模式之间的相似/相异度,每个用户访问模式都被转换成具有相等长度的模糊向量,其中每个元素要么是0要么是模糊语言变量,它体现了用户是否访问过该网页及在该网页上的浏览时间.由于类的边界可能是模糊的,因而使用粗糙k-均值法对这些代表用户浏览特征的模糊向量进行聚类.最后使用Davies-Bouldin指标来衡量聚类的效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号