首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
基于混合多指标信息的聚类分析   总被引:1,自引:0,他引:1  
针对具有实数值、区间数和自然语言等形式的混合多指标信息的聚类分析问题.基于传统的数值信息FCM聚类算法,提出了一种新的聚类分析算法。在该方法中。首先描述了具有混合多指标信息的聚类分析问题,提出了基于混合多指标信息的关于确定最优划分和最优聚类中心的两个定理。然后给出了基于混合多指标信息的FCM聚类算法的选代步骤。最后给出了一个算例。  相似文献   

2.
自动化系统数据挖掘问题的模拟退火解法   总被引:2,自引:0,他引:2  
数据挖掘是近年来发展起来的新技术,指挥自动化的辅助决策过程也越来越依靠数据挖掘求解。通过数据挖掘,可以有效地处理海量数据,为正确决策提供支持。模拟退火是一种性能优越的计算智能算法,广泛应用于求解非线性最优化问题。数据挖掘中的数据聚类与模拟退火在本质特性上存在相似,可以将模拟退火应用于数据挖掘。通过蒙特卡罗方法生成随机数据,进行基于模拟退火的聚类分析。算例表明,新方法能够很好地进行数据聚类,具有较好的适用性。  相似文献   

3.
基于多维伪F统计量的基因表达动态聚类分析方法研究   总被引:2,自引:1,他引:2  
K-均值聚类分析算法是一种广泛应用于基因表达数据聚类分析中的迭代变换算法,它通过指定类别数K-基于给定的聚类目标函数,并采用迭代更新的方法,使得最终的聚类结果的目标函数值为极小值,达到较优的聚类效果。针对K-均值聚类分析算法存在参数依赖性强,且在整个聚类过程中类的数目无法改变的缺点,引入动态调整聚类个数的思想和多维伪F统计量,提出了一种基于多维伪F统计量的基因表迭动态K-均值聚类算法。实验结果表明该算法可以动态调整聚类个数,给出最佳聚类数目,从而获得较好的聚类质量.  相似文献   

4.
离群数据挖掘是数据挖掘研究的重要内容,在实际生活中获得广泛应用.论文结合了免疫算法全局搜索的优点和K-均值方法局部收敛速度快的特点,提出了一种基于免疫聚类算法的离群数据挖掘方法,有效地克服了传统聚类方法对初始化敏感、容易陷入局部最优等缺点,使聚类结果能够快速收敛到全局最优,有效地检测离群数据.实验结果表明,该方法实用有效的.  相似文献   

5.
一种基于区间数多指标信息的FCM聚类算法   总被引:8,自引:0,他引:8  
针对一类具有不确定性区间数多指标信息的聚类分析问题,基于传统的数值信息FCM(fuzzy c-means)聚类算法,提出了一种新的聚类分析算法.首先描述了具有区间数多指标信息的聚类分析问题,其次提出并证明了基于区间数多指标信息的关于最优划分和最优聚类中心确定的两个定理.然后根据提出的两个定理,进一步给出了基于区间数信息的FCM聚类算法的迭代步骤.最后,通过一个算例说明了给出的聚类算法.  相似文献   

6.
李序  张葛祥 《系统仿真学报》2008,20(23):6333-6337
无监督学习是解决未知雷达辐射源信号识别的有效方法。Support Vector Clustering(SVC)是一种基于支持向量机的无监督聚类方法。SVC不仅时间复杂度高,而且在处理分布复杂、不均匀样本时,识别率较低。结合K-均值与SVC的优点,提出一种基于K-均值的SVC无监督聚类方法。此方法用K-均值聚类法对数据样本作初步的线性划分,将原数据样本划分成若干子样本。再将这些子样本分别映射到高维特征空间,用SVC方法去处理非线性问题。由K-均值聚类法将二次规划问题分解,大大减少SVC的计算量,降低时间消耗。相对于原数据样本,子样本的分布较为简单、均匀,容易找到更为合适的SVC参数值。对雷达辐射源信号进行聚类分析的实验结果表明,此方法处理速度较快,识别率较高。  相似文献   

7.
基于K-means算法的改进蚁群聚类算法及其应用   总被引:2,自引:0,他引:2  
基于化学识别的蚁群聚类算法无需给定聚类数目就能自动实现数据集的聚集,但大量采用随机策略使得蚂蚁达到平衡的运行时间长,效率不高。为此提出了一种用K-means算法做初次聚类、蚁群聚类算法再次聚类的新算法,结果表明该算法具有较高的正确率。最后将该算法应用于系统应用协同中,得到了较好的分析结果。  相似文献   

8.
具有不同到达时间的差异工件批调度问题的蚁群聚类算法   总被引:2,自引:0,他引:2  
研究具有不同到达时间的差异工件在单机环境下的批调度问题.通过引入工件单元的概念并对分批约束进行松弛,提出了该问题的一个新的下界,证明了该下界的有效性.将蚁群算法和聚类算法相结合,提出了一种基于多阶段聚类的蚁群聚类算法ACC(Ant colony clustering).算法首先利用K-均值聚类将工件分簇,在簇内部通过蚁群算法搜索分批,最后提出一个全局优化算法对局部分批结果进行合成和优化.克服了蚁群算法随着工件规模增大求解时间过长的问题,适合于求解大规模算例.实验结果表明:与现有的启发式规则LPTBFF(Longest processing time batchfirst fit)和HGA(Hybrid Genetic algorithm)算法相比,该算法求解效果更好.  相似文献   

9.
蔡荣太  王延杰 《系统仿真学报》2008,20(22):6029-6032,6038
对稀疏混合数据进行分析,发现该类数据具有方向性聚集分布的特点。首先证明了可以采用方向性聚类方法对稀疏混合数据进行处理分离出原数据。即用方向性聚类算法对稀疏混合数据进行聚类分析可以估计出混和矩阵。然后证明采用方向性聚类算法分离出来的数据和原数据之间具有确定的尺度和次序变化关系。最后针对多通道混合数据的盲分离提出了基于中心矢量聚类的稀疏混合数据分离算法SMDDCVC(sparse mixing data decomposition based on center vector clustering),并将该算法用于稀疏混合图像的盲分离。实验结果表明基于SMDDCVC算法的稀疏混合数据盲分离算法是有效的。  相似文献   

10.
提出了一种区间值聚类的数据挖掘方法。该方法首先将数据库中的数据按照属性进行聚类,将它们划分为若干区间,对于同一区间中的数据赋予相同的编号,以此处理直至数据库的最后一个属性。在完成这种转换后即可使用关联规则的挖掘方法。该方法与传统的数据挖掘方法相比更加符合实际。大量的仿真数据集和真实数据集的实验结果表明该算法是有效的。  相似文献   

11.
Most of the earlier work on clustering mainly focused on numeric data whose inherent geometric properties can be exploited to naturally define distance functions between data points. However, data mining applications frequently involve many datasets that also consists of mixed numeric and categorical attributes. In this paper we present a clustering algorithm which is based on the k-means algorithm. The algorithm clusters objects with numeric and categorical attributes in a way similar to k-means. The object similarity measure is derived from both numeric and categorical attributes. When applied to numeric data, the algorithm is identical to the k-means. The main result of this paper is to provide a method to update the “cluster centers“ of clustering objects described by mixed numeric and categorical attributes in the clustering process to minimise the clustering cost function. The clustering performance of the algorithm is demonstrated with the two well known data sets, namely credit approval and abalone databases.  相似文献   

12.
基于核密度估计的层次聚类算法   总被引:12,自引:0,他引:12  
淦文燕  李德毅 《系统仿真学报》2004,16(2):302-305,309
聚类分析是统计、模式识别和数据挖掘等领域中一个非常基础且非常重要的研究课题,具有广泛的应用前景。在众多的聚类方法中,基于密度的方法是一种相当有效的聚类方法,能够发现任意形状的聚类,对噪声数据不敏感,但是聚类结果严重依赖于用户参数的合理选择。以DENCLUE算法为基础,一种基于核密度估计的层次聚类算法被提出,该算法首先优选窗宽σ产生较好的核密度估计结果,然后以密度函数的局部极大值点为聚类中心形成数据的初始划分,最后根据密度函数的鞍点递归合并初始聚类产生不同层次的划分模式。理论分析和仿真实验结果显示,该算法能够发现任意形状、大小和密度的聚类,能够有效处理噪声数据,而且聚类结果不依赖于用户参数的仔细选择。  相似文献   

13.
一种基于会话聚类算法的Web使用挖掘方法   总被引:1,自引:0,他引:1  
Web使用挖掘作为数据挖掘的一个重要任务,有助于了解用户群体的特征,从而为其提供个性化服务.提出了一种基于用户会话聚类的Wei使用挖掘算法.首先,对Web日志预处理采用基于时间窗的用户会话识别方法,提出了一种基于三元组的用户会话表示方法,并在此基础上给出了基于网页语义相似性的会话处理方法,该方法能够在保持用户兴趣不变的情况下有效降低会话维度;其次,提出了一种基于时间及频次的用户会话相似性度量方法;最后,设计了一种两阶段PS-KM会话聚类算法,先用PSO方法进行全局搜索再转入基于K-means方法的局部聚类过程.仿真表明了算法的有效性.  相似文献   

14.
对并行图聚类算法进行了研究。基于Spark 提出了一个新的并行图聚类算法;由于Spark 中的top 操作需要耗费大量的内存,提出了一个新算法来替代top 操作,有效减少了所消耗的内存;通过对自底向上的层次聚类算法进行改进提高了聚类的速度;基于图数据的特征提出了一种图数据过滤的方法来减少算法运行的时间以及所占用的空间并对其有效性进行了说明。仿真结果表明,运行效果优于进行比较的其他并行化图聚类算法。  相似文献   

15.
A new fuzzy support vector machine algorithm with dual membership values based on spectral clustering method is proposed to overcome the shortcoming of the normal support vector machine algorithm,which divides the training datasets into two absolutely exclusive classes in the binary classification,ignoring the possibility of "overlapping" region between the two training classes.The proposed method handles sample "overlap" efficiently with spectral clustering,overcoming the disadvantages of over-fitting well,and improving the data mining efficiency greatly.Simulation provides clear evidences to the new method.  相似文献   

16.
1.INTRODUCTION Fuzzyclusteringisanunsupervisedwayofdatagrouping andusefulinpatternrecognition,informationretrieval,imageprocessing,faultdetection[1,2].Itgroupsdatainto finiteclustersbyusingsomekindsofmeasuressuchasthe linearandnon lineardistance,theentropymeasure,or inclusiondegreeinfuzzyenvironments.Intermsofthe modelsandmeasuresbetweenobjects,differentalgo rithmspartitiondifferentdatasetsandproduceclusters withdifferentshapesandhavedistinctdifferenceintime andspaceefficiency.Currentclus…  相似文献   

17.
一种使用支撑集的区域型模糊聚类算法   总被引:1,自引:0,他引:1  
使用支撑集和模糊待分集的概念来描述数据集的分布。在此基础上提出了一种基于类别融合的区域型模糊聚类算法 (regionalfuzzyclusteringalgorithm ,RFCA) ,并就该模型的两个聚类参数 (δ和ε)对聚类性能的影响进行了分析。仿真结果表明 ,该算法有比常用的模糊C均值更好的聚类性能。  相似文献   

18.
基于遗传优化的采样模糊C均值聚类算法   总被引:14,自引:0,他引:14  
在数据挖掘领域,模糊C均值聚类法(FCM)在处理小量低维的数据挖掘时是有效的,但是面向数据库的数据挖掘经常要处理大量、高维的数据.在这种情况下,FCM算法在时间性能上难以令人满意.本文基于采样技术对FCM算法进行改进,以提高算法的时间性能,并利用遗传算法对聚类结果进行优化以保证聚类的质量,给出了一种新的基于遗传优化的采样模糊C均值聚类算法SFGO(SamplingFCMwithGeneticOptimization).仿真实验证明SFGO算法在大规模数据库的聚类挖掘中,在时间性能和聚类质量上都能获得较满意的结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号