首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 906 毫秒
1.
针对传统谱聚类算法在非平衡数据集上聚类效果不理想的问题,提出了一种平衡化谱聚类算法,该算法在传统谱聚类目标函数的基础上加入了对聚类隶属度矩阵的近似正交约束,从而得到新的聚类目标函数.实验结果表明,新算法可以缓解传统谱聚类产生的均匀效应,提升了在非平衡数据集上的聚类纯度.  相似文献   

2.
一种改进的灰色聚类方法   总被引:4,自引:0,他引:4  
作者对灰色聚类方法进行改进,提出了一种新的灰色聚类方法--改进灰色聚类方法,给出了此方法进行聚类的步骤,并结合实例说明其应用及优点。  相似文献   

3.
一种增量式文本软聚类算法   总被引:1,自引:0,他引:1  
针对传统文本聚类算法时间复杂度较高,而与距离无关的算法又不适用于动态、变化的文本集等问题,提出了一种基于语义序列的增量式文本软聚类算法.该算法考虑了长文本的多主题特性,并利用语义序列相似关系计算相似语义序列集合的覆盖度,同时将每次选择的具有最小熵重叠值的候选类作为一个结果聚类,这样在整个聚类的过程中大大减小了文本向量空间的维数,缩短了计算时间.由于所提算法的语义序列只与文本自身相关,所以它适用于增量式聚类.实验结果表明,算法的聚类精度高于同条件下的其他聚类算法,尤其适合于长文本集的软聚类.  相似文献   

4.
动态模糊ISODATA聚类方法及其在故障诊断中的应用   总被引:2,自引:0,他引:2  
根据故障诊断分类的特点,用变分原理导出了动态聚类的最优解的存在条件,讨论了相应的算法及其收敛性,并在柴油机供油系统故障诊断中的实现故障分类的动态表示,证明了其在故障分类识别中的有效性。  相似文献   

5.
在传统层次聚类基础上,提出并实现了一种基于距离的增量式聚类算法,并应用于粮食智能决策支持系统中,算法在保持层次聚类优点的基础上,利用原有的聚类结果提高聚类速度,并可以根据用户需要在聚类精度和聚类速度两方面选取一个适当的平衡点,有效地提高聚类分析的效率。  相似文献   

6.
基于聚类分析的油气成因类型判别   总被引:1,自引:0,他引:1  
油气成因类型的确定是油气成藏研究的重要基础,常规的定性描述与经验公式存在一定的局限。聚类分析从数学模型入手,通过相似统计量来衡量地质样品或分析指标间的相关性。通过介绍了树状聚类、逐步聚类和双向聚类的原理和方法,并分别应用于油气成因类型研究中,结果表明聚类分析适合多要求下的成因判别,克服了常规方法的局限,判别结果清楚、正确。  相似文献   

7.
以基于模糊c—划分的聚类方法为基础,针对影响目标函数聚类法聚类效果的主要因素,分别从5个主要方面作了聚类算法的适用性分析。  相似文献   

8.
提出了基于分布式聚类的异常入侵检测方法ID—DC,通过对训练集进行分布式聚类产生聚簇模型,采用基于双参考点的标识算法Double—Reference标记异常簇,不需要具有类别标签的训练集且可自动确定聚簇模型的个数.实验中采用了网络入侵检测数据集KDD—CUP-99来训练模型.实验结果表明:通过采用分布式聚类算法建立的分布式入侵检测模型可有效地检测攻击,检测率高,误警率低.  相似文献   

9.
针对当前三支聚类方法不能有效处理数值型数据,且三支聚类结果受阈值影响问题,文章基于邻域关系提出了确定合适阈值的三支聚类方法。首先给出了确定最优K值的改进K-means聚类算法。进而基于邻域关系下的下、上近似引入精度,提出了权衡边界域和精度关系的有效性评价指标。应用该指标,给出了确定邻域下、上近似中最佳阈值的构建算法,进而得到三支聚类的核心域和边界域。最后,通过UCI数据集上的实验验证了该方法的可行性,且该方法有效提高了聚类精度。  相似文献   

10.
研究了最小一乘下的PPk-聚类问题,给出了相合性,得到了与最小二乘情形下类似的结论。  相似文献   

11.
基于模糊贴近关系的模糊聚类及其有效性   总被引:2,自引:0,他引:2  
讨论了模糊聚类的两个基本问题:聚类方法和有效性评价,作为通常模糊等价关系聚类方法的扩展,给出了一种用三角算子和模糊贴近关系进行模糊聚类的方法,同时以样本原始信息和聚类结果为基准,提出了一种度量聚类有效性的方法。最后的例子表明该方法是有效的。  相似文献   

12.
介绍了聚类误差平方和准则,指出了误差平方和准则的不足,提出了误差绝对值和准则、最大误差准则以及误差p次方和准则.  相似文献   

13.
一种基于改进的RBF神经网络的铁水脱硫预报模型   总被引:7,自引:1,他引:7  
脱硫过程是炼钢生产中一个十分重要的环节。脱硫效果的好坏,直接关系到炼钢生产能否保质保量地进行,而这又取决于对脱硫过程的控制,其关键是脱硫剂的加入量。因而必须建立脱硫过程模型,实时和高精度地预报脱硫剂的加入量。而脱硫过程又是一个非常复杂的工艺过程,采用传统的方法建立的模型无法保证稳定和高精度的脱硫效果。笔者提出了一种基于改进的RBF神经网络的铁水脱硫预报模型及其具体设计方法,并在炼钢厂进行了实际投运。结果表明,该模型性能良好,这同时说明了设计方法的有效性和实用性。  相似文献   

14.
给出了一种新的处理海量数据的聚类算法WIDE(window-density clustering algorithm).它通过网格方法将数据之间的相互关联局部化,通过窗口技术来提高算法的效率,通过密度方法提高聚类的精度.以窗口为中介将网格方法和密度方法融合在一起是算法的主要思想.在此基础上对算法进行了扩展,在功能方面实现了混合型数据聚类、含障碍物数据聚类和增量数据聚类;在速度方面实现了分布式并行聚类.WIDE算法能够在局域网中的多台计算机上并行工作,效率高,计算复杂度为O(N),且能够发现任意形状的聚类,对噪声不敏感.  相似文献   

15.
良好的人格素质是大学生成才的关键因素。本文试图用灰色聚类法对大学生人格素质进行评估,以期取得实际效果,为高校教育工作者提供了解学生人格素质的途径。  相似文献   

16.
一个基于K-means的聚类算法的实现   总被引:9,自引:0,他引:9  
聚类算法作为数据挖掘中的一种分析方法,它能找到样本比较密集的部分,并且概括出样本相对比较集中的区域.分析了传统的聚类算法及局限性,讨论了一个基于K-mealls算法的实现过程,使得算法可处理存在孤立点的大文档集,得到最佳的聚类结果。  相似文献   

17.
基于随机抽样和聚类特征的聚类算法   总被引:5,自引:0,他引:5  
在分析BIRCH算法不足的基础上,提出了一种基于随机抽样和聚类特征的聚类算法(CLAP),该算法采用随机抽样技术,从数据库中抽取一部分数据进行聚类的预处理过程,这样大大降低了运行时间,CLAP通过设立索引树的叶节点的直径和聚类直径,提高了聚类的精度,并采用全局搜索和局部搜索相结合的方式,消除了输入顺序对聚类质量的影响.测试结果表明,CLAP算法不仅提高了聚类速度,而且改善了聚类质量。  相似文献   

18.
图像聚类是当前的研究热点,非负矩阵分解(non-negative matrix factorization, NMF)算法在图像聚类领域得到了广泛应用。但是单一的NMF算法无法应用于所有数据集,并且NMF算法直接在数据的原始空间进行处理,抗噪能力较差。集成聚类可以解决上述问题,集成聚类将若干个基础聚类结果合成一个一致性结果,不仅可以提高聚类的求解质量,还可以增强算法的鲁棒性。因此本文提出一种层次预处理的NMF加权集成聚类算法。该算法将层次划分、集成聚类和二部图的思想引入到NMF算法中。在预处理阶段,利用层次划分得到聚类数目。之后采用局部加权的方法得到协关联矩阵。最后利用基于二部图的一致性函数进行划分得到最终的聚类结果。在5个数据集上进行实验,验证了本文算法相对于传统算法和其他集成算法的有效性。  相似文献   

19.
基于SOM网络的上市公司聚类分析   总被引:1,自引:0,他引:1  
针对现有上市公司聚类模型(如传统的统计方法和近年来出现的模糊模型)实际聚类效果并不理想的问题,引入了自组织特征映射神经网络方法,为了说明该方法的可应用性,建立了上市公司聚类指标体系,并在实际数据样本的基础上,利用自组织特征映射神经网络方法对上市公司进行了分类评价.通过对其结果进行分析,证实了该方法能有效地解决这一问题.  相似文献   

20.
提出了一种采用直方图小波变换获得初始聚类原型的图像纹理分割模糊算法;多纹理图像采用自相关函数作为纹理测度,再对图像自相关函数直方图作小波多分辨分析得到初始聚类原型,利用模糊C-均值聚类算法进行纹理分割;对合成纹理图像的实验结果表明了该算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号