首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 293 毫秒
1.
用K均值算法进行文本聚类通常只能以局部最优结束,很难找到全局最优.文章提出了一种基于混沌社会演化算法的文本聚类新方法.在该方法中提出了认知主体在聚类中对范式继承的方式,在认知主体对范式的背叛中提出一种混沌变异算子.实验证明该方法不但能有效地提高文本聚类的效率而且能有效地提高文本聚类的精度.  相似文献   

2.
针对现有区间数聚类算法对多种聚类模式以及不对称数据聚类性能不理想的问题,本文提出了一种基于核方法的区间数模糊聚类算法.该方法通过设计合适的核函数,有效地对非对称数据以及混合模式原型的数据结构进行聚类,同时避免了直接在高维特征空间求解聚类问题.本文采用区间数遗传算法来求取高度非凸聚类优化问题得到聚类问题的全局最优解.仿真实例说明了本文算法的有效性.  相似文献   

3.
基于遗传优化的采样模糊C均值聚类算法   总被引:14,自引:0,他引:14  
在数据挖掘领域,模糊C均值聚类法(FCM)在处理小量低维的数据挖掘时是有效的,但是面向数据库的数据挖掘经常要处理大量、高维的数据.在这种情况下,FCM算法在时间性能上难以令人满意.本文基于采样技术对FCM算法进行改进,以提高算法的时间性能,并利用遗传算法对聚类结果进行优化以保证聚类的质量,给出了一种新的基于遗传优化的采样模糊C均值聚类算法SFGO(SamplingFCMwithGeneticOptimization).仿真实验证明SFGO算法在大规模数据库的聚类挖掘中,在时间性能和聚类质量上都能获得较满意的结果.  相似文献   

4.
基于免疫算法的前向神经网络学习方法   总被引:2,自引:0,他引:2  
提出了一种采用免疫算法训练多层前向神经网络的方法。该方法利用免疫算法训练前向神经网络,能够使网络优化过程趋于全局最优。利用基于遗传策略的聚类机制确定前向神经网络的初始权值,增加了网络训练算法收敛于全局最优的概率。将这种神经网络用于雷达模拟调制信号的调制方式识别的仿真结果表明,采用该算法设计的前向神经网络达到了较高的性能。  相似文献   

5.
基于粒子群的K均值聚类算法   总被引:43,自引:0,他引:43  
针对K均值聚类算法存在的缺点,提出了一种新的聚类算法———基于粒子群的K均值聚类算法,并将此算法与现有的基于遗传算法的K均值聚类算法进行比较.理论分析和数据实验证明,该算法有较好的全局收敛性,不仅能有效地克服传统的K均值算法易陷入局部极小值的缺点,而且全局收敛能力优于基于遗传算法的K均值聚类算法.  相似文献   

6.
传统的离群数据挖掘方法大多数是利用全局的观点看待离群数据,很难发现低维子空间中的偏移数据.利用微粒群算法(PSO)具有简单,容易实现并且没有许多参数需要调整等优势,提出了一种基于PSO和子空间的离群数据挖掘算法(OM-PSO).该算法首先将子空间看作微粒,根据偏离数据所在子空间的稀疏系数,采用带有变异算子的PSO算法来搜索子空间,并将子空间中的数据看作为局部偏离数据,即离群数据;最后采用离散化的天体光谱数据作为数据集,实验结果验证了该算法的有效性.  相似文献   

7.
利用灰色系统理论是研究贫信息系统分析、建模、预测、决策、控制的有效工具的特性,针对系统样本数据量不大或有残缺,样本数据更新变换快,整体数据规律相当复杂,而在某一时间或空间的数据却有很强的规律性之类的贫信息灰色系统中的数据挖掘课题,探讨了灰色系统理论与技术在数据挖掘中的应用问题,提出了贫信息灰色数据挖掘的灰色关联算法、灰色统计算法、灰色聚类算法、灰色统计聚类算法,并提出了灰色系统数据挖掘的体系结构。  相似文献   

8.
时间序列数据量远远大于普通数据库的特点,导致一些通用的数据挖掘工具直接应用于时间序列效果很不理想。为此提出了一种时间序列分段线性化表示算法,这种表示方法将大大提高相似性测量的计算速度。在分段线性化表示的基础上提出了一种相似性计算方法,该方法对于时间序列的多种变形都不敏感。将k-平均(k-mean)聚类算法应用于分段线性化表示的时间序列,聚类结果表明算法非常有效。  相似文献   

9.
提出了一种区间值聚类的数据挖掘方法。该方法首先将数据库中的数据按照属性进行聚类,将它们划分为若干区间,对于同一区间中的数据赋予相同的编号,以此处理直至数据库的最后一个属性。在完成这种转换后即可使用关联规则的挖掘方法。该方法与传统的数据挖掘方法相比更加符合实际。大量的仿真数据集和真实数据集的实验结果表明该算法是有效的。  相似文献   

10.
基于摄动的模糊聚类算法最优模糊等价矩阵相关性质分析   总被引:1,自引:1,他引:0  
对基于摄动的模糊聚类算法进行深入研究.给出一个模糊相似矩阵的实例,存在与该矩阵距离相同且都是最小的两个不相等的模糊等价矩阵,从而证明了全局最优模糊等价矩阵不具有唯一性.对基于摄动的模糊聚类算法求出的可行解的不同情况进行分析,给出了每种情况下可行解个数的计算表达式.完善了基于摄动的模糊聚类算法的相关理论.  相似文献   

11.
一种基于会话聚类算法的Web使用挖掘方法   总被引:1,自引:0,他引:1  
Web使用挖掘作为数据挖掘的一个重要任务,有助于了解用户群体的特征,从而为其提供个性化服务.提出了一种基于用户会话聚类的Wei使用挖掘算法.首先,对Web日志预处理采用基于时间窗的用户会话识别方法,提出了一种基于三元组的用户会话表示方法,并在此基础上给出了基于网页语义相似性的会话处理方法,该方法能够在保持用户兴趣不变的情况下有效降低会话维度;其次,提出了一种基于时间及频次的用户会话相似性度量方法;最后,设计了一种两阶段PS-KM会话聚类算法,先用PSO方法进行全局搜索再转入基于K-means方法的局部聚类过程.仿真表明了算法的有效性.  相似文献   

12.
谭华  谢赤  储慧斌 《系统工程》2007,25(4):92-97
将模糊关联规则应用于股票市场的交易规则抽取,以期能为投资者投资做出正确决策.首先选用聚类方法对模糊集属性进行离散化,进而构造模糊集和隶属函数,给出模糊集构造算法,最后提出适合股票交易规则抽取的模糊关联规则算法FARS.实验结果表明,所得规则能很好的反映股票交易中的实际情况.  相似文献   

13.
建立了多维属性样本的模糊聚类目标函数.构建了引导进化算法收敛的指数函数曲线模型,给出了模型的参数计算方法.设计了一种具有全局变异和局部变异算子的进化模糊聚类算法,根据全局变异前后个体适应度值和分量值的变化趋势,实现定向变异,并给出了算法的种群进化策略.选择文本分类和点聚类计算实例,实验表明,设计的引导函数是有效的.进化模糊聚类算法具有较强的局部寻优能力,在收敛速度和聚类精度方面优于比较的遗传模糊C-均值聚类等算法.  相似文献   

14.
With an aim to the fact that the K-means clustering algorithm usually ends in local optimization and is hard to harvest global optimization, a new web clustering method is presented based on the chaotic social evolutionary programming (CSEP) algorithm. This method brings up the manner of that a cognitive agent inherits a paradigm in clustering to enable the cognitive agent to acquire a chaotic mutation operator in the betrayal. As proven in the experiment, this method can not only effectively increase web clustering efficiency, but it can also practically improve the precision of web clustering.  相似文献   

15.
分布式系统中的元挖掘研究   总被引:1,自引:0,他引:1  
针对分布式系统中的数据挖掘问题,提出了一种新颖高效的分布式元挖掘方法。该算法只需在各自站点扫描局部数据库两次即可形成局部和全局频繁项集,并根据局部和全局频繁项集形成相应的关联规则集及元规则集。在形成元规则集时无需扫描各站点中的关联规则集,这样既减少了分布式系统中需要的通信交换的数据量,也减少了各站点中的扫描数据量。研究表明所提出的算法是有效的。  相似文献   

16.
一种基于互信息的词聚类算法   总被引:1,自引:0,他引:1  
基于类的统计语言模型是解决统计模型数据稀疏问题的重要方法.传统的统计聚类方法基于贪婪原则,常以语料的似然函数或困惑度(perplexity)作为评价标准.这种传统的聚类方法的主要缺点是聚类速度慢,初值对结果影响大,易陷入局部最优.本文利用互信息定义了一种词相似度,在词相似度的基础上给出了词集合相似度的定义.基于相似度,提出了一种自下而上的分层聚类算法,这种方法不但能改善聚类效果,而且可根据不同的模型选择不同的相似度定义,因而提高聚类的使用效果.实验证明,该算法在计算复杂度和聚类效果上比传统的基于贪婪原则的统计聚类算法都有明显的改进.  相似文献   

17.
为提高关联规则挖掘算法的效率及其对大型数据集的适应性,提出了基于划分的带项目约束的频繁项集挖掘算法Partition CHS Miner。算法按照约束条件裁减数据集,并采用基于约束的超结构CHS(con-straint-based hyper-structure)存储数据。对大型数据集,先将其划分为多个不相交的数据子集,使子集的大小适合主存,然后在子集上采用基于超结构的带项目约束的挖掘算法挖掘出局部频繁项集,最后合并所有子集中的频繁项集形成全局的带约束的候选项集,计算出全局频繁项集。实验证明了算法的有效性。  相似文献   

18.
目前对全球导航卫星系统(global navigation satellite system, GNSS)三频组合观测值优选的研究,主要集中在全球定位系统(global positioning system, GPS)和北斗二号(beidou navigation satellite system, BDS-2)上,对BDS-3的研究相对较少。为克服以往聚类优选算法中存在的仅适用于类球形簇、聚类数目和初始聚类中心的确定主观性强、对离群点敏感、易陷于局部最优等不足,提出一种改进的核模糊C均值聚类算法,引入核函数与抑制离群点的新距离度量,基于多类广义核极化准则优化核参数,用改进爬山法确定聚类数目与初始聚类中心。然后,以模糊C均值聚类算法为对照进行了对比实验,在短、长两种基线下分别解算组合模糊度。通过对优选所得代表性组合的模糊度固定成功率进行对比分析,验证了该算法的可行性与算法改进的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号