首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 843 毫秒
1.
经典的聚类分析方法在统计时需要事先设置参数,而在没有先验知识情况下,确定这些参数是比较困难的。为此,提出了一种全新的灰聚类分析方法并完整地定义了其数学模型。该方法不再受样本输入次序的限制,也不需要事先确定参数。通过仿真实验证明,该方法具有较强的抗噪音能力,能有效地避免人为因素对聚类结果的影响,能使聚类结果更客观、准确。将该方法运用于股票数据分析中的实验结果表明,该分析结果能为投资者提供一定价值的决策意见,具有一定的实用价值。  相似文献   

2.
K均值聚类算法初始质心选择的改进   总被引:3,自引:0,他引:3  
聚类分析在信息检索和数据挖掘等领域都有很广泛的应用,K均值聚类算法是一个比较简洁和快速的聚类算法,但是它存在着初始聚类个数必须事先设定以及初始质心的选择也具有随机性等缺陷,造成聚类的结果不是最优的。针对K均值聚类算法中的随机指定初始质心的缺点,提出了基于密度和最近邻相似度的初始质心选择算法,实验显示该算法可以生成质量较高而且较稳定的聚类结果,但是改进的算法需要事先设定最近邻相似度的阈值计算量较大等缺点,还有待改进。  相似文献   

3.
模糊超球质心聚类神经网络   总被引:1,自引:0,他引:1  
基于人的大脑进行聚类分析所遵循的基本原则,提出了一种模糊超球质心聚类神经网络学习算法,该方法无需用户事先给定聚类个数K,通过神经网络自组织学习,可以正确识别聚类个数与聚类中心。实验结果表明,该算法是一种全新的聚类方法,具有学习时间短,稳定性强且不依赖于聚类样本的输入顺序等优点。  相似文献   

4.
一种新的基于蚁群原理的聚类算法   总被引:1,自引:1,他引:0  
为了改善聚类分析的质量,提出一种与蚁群原理相结合的聚类方法. 首先对传统的聚类算法k-means进行改进,克服传统的k-means算法必须事先确定分类的个数k和选择聚类点的缺陷,然后将蚁群算法的转移概率引入k-means算法,对上述聚类结果进行二次优化.实验结果表明,改进的k-means与蚁群算法相结合的聚类方法比单一聚类算法更有效.  相似文献   

5.
目前谱聚类在文本分类、图像分割和信息检索等领域的应用越来越引起研究者的重视,并取得了一定的成果、但是,大多数已有的谱聚类算法需要事先给定聚类数.在k-means算法、EM等聚类方法中也存在相似的问题、在此介绍了一种简单的容易实现的谱聚类算法,可以自动确定合适的聚类数.实验表明本算法结果很好、  相似文献   

6.
研究了基于可能性熵理论的聚类问题.首先定义并讨论了可能性熵,继而将可能性熵引入聚类分析,提出了可能性熵聚类算法.它考虑到熵聚类的全局和局部效应,具有清晰的物理意义和数学特征.该算法还能在聚类过程中自动地确定分辨率参数,克服了对于噪声和外围点的敏感性.仿真实验证明,即使各类大小不一,数据集被强噪声所污染时,该算法仍能有效地估计各类中心.  相似文献   

7.
DBSCAN算法中参数自适应确定方法的研究   总被引:2,自引:0,他引:2  
在DBSCAN算法中需要人工输入Eps和MinPts两个参数,因而聚类过程需要用户的干预才能进行,导致聚类结果的准确度直接取决于用户对参数的选择。鉴于此,本研究提出了一种新的Eps和MinPts参数的确定方法,避免了聚类过程中的人工干预,实现了聚类过程的全自动化。理论分析和实验结果表明,该方法能够选择合理的Eps和MinPts参数并得到较高准确度的聚类结果。  相似文献   

8.
针对舰船噪声信号的不平稳性对噪声目标聚类准确率的影响,提出了一种新颖的基于演化的目标聚类分析方法,实验表明该方法较k-均值聚类算法具有更高的聚类准确率,能有效地克服目标信号不平稳性造成的类间混叠现象。  相似文献   

9.
一种基于遗传算法的混合聚类技术   总被引:1,自引:1,他引:0  
模糊C- 均值算法是一种比较有的数据聚类方法,然而在聚类数不能事先确定,或样本空间太大时,聚类非常困难。遗传算法是一种借鉴生物界自然选择和自然遗传机制的高度并行、随行、自适应的搜索算法。将遗传算法与模糊聚类技术结合起来,提出一种混合聚类的方案。该方案能够快速正确的实现聚类,且不需事先认定聚类数。实验结果令人满意。  相似文献   

10.
K -均值聚类算法在当前提取数据挖掘的聚类分析方法中已经取得了一定的成就,为了进一步改进其在数据预处理及神经网络结构中的应用,文中对算法进行了缺陷研究,主要做了以下几个方面的工作:对K-means算法进行了思路及算法主要流程分析;得出K-均值聚类算法存在简单、迅速、结果簇密集、簇与簇之间区别较为明显等优点;分析得出算法存在与处理符号属性的数据不太适应、必须事先给出k值(想要生成的簇的个数)、对“噪声数据”以及孤立的点数据有较大影响、需要不断计算更新调整后的新聚类中心等缺点。在实验验证中结果得出:聚类结果可知,选取不同的值初始值对聚类结果的影响很小;如果聚类数据集迭代次数较多时,可以尝试着改变其数据的输入顺序;变动数据集的输入顺序,会直接影响聚类结果。实验结果对于K-均值算法的工作效率提高了具有明显的参考价值,这一研究对于数据挖掘技术的改进具有一定的意义。  相似文献   

11.
针对高维数据的聚类过程不够直观、聚类结果也不易解释的问题,本文提出了一种基于改进雷达图的交互式可视化聚类方法。首先对传统雷达图进行了改进,采用熵权法确定数据的主要特征和属性排列,在去掉非主要特征基础上采用以极径表示属性值,以属性权重确定极角的改进雷达图进行数据可视化来突出数据的主要特征;然后采用改进的k-means算法对平面上的点集进行聚类,该改进算法不需事先给定簇的个数,能够依据密度和距离对初始中心进行优化,且在聚类过程中可交互调整参数,并使用不同颜色来区分不同类别,方便观察聚类过程和结果;最后通过仿真实验表明改进的雷达图更能反应数据的分布情况,改进的聚类算法具有更高的效率和聚类准确度。  相似文献   

12.
针对雷达辐射源信号参数严重混叠、聚类数目未知等问题,提出一种基于入侵性杂草优化模糊聚类的智能算法,该算法无需事先设定聚类数目,而是在整个数据集的属性空间内并行搜寻最佳的聚类数目和聚类中心,具有结构简单、鲁棒性好的特点。将此方法应用到雷达信号的分选当中,并与传统的K均值算法及AP聚类算法进行对比,实验结果验证了该算法的有效性。  相似文献   

13.
一种确定最佳聚类数的新算法   总被引:1,自引:0,他引:1  
针对K-均值聚类算法需要事先确定聚类数K的问题,将粒度计算引入样本相似度函数,定义了新的样本相似度,用模糊等价聚类确定数据集可能的最大类簇数Kmax.以Kmax为搜索上界,利用改进全局K-均值聚类算法,以BWP(Between-Within Proportion)为聚类有效性度量指标,提出确定最佳聚类数的一种新方法.通过UCI机器学习数据库数据集以及随机生成的人工模拟数据集实验测试,证明该算法不仅能有效确定数据集的最佳聚类数,而且适用于大规模数据集,但是会受到噪音点影响.  相似文献   

14.
语音识别中基于模糊聚类分析的参数聚类   总被引:1,自引:0,他引:1  
徐向华  朱杰  郭强 《上海交通大学学报》2004,38(12):2086-2088,2093
为减少语音识别中声学模型的参数量,提高参数训练的鲁棒性,基于声学决策树结构,提出利用模糊聚类分析方法对模型参数聚类,包括高斯聚类和方差共享.对大词汇量汉语连续语音识别的实验结果表明:高斯模糊聚类使高斯数减少25%时,识别率提高了0.15%.进一步做模糊方差共享,当方差减少到初始模型的24%,与同样参数量的未进行聚类的模型相比,误识率下降了3.01%,证明了模糊聚类分析在语音参数聚类中的有效性.  相似文献   

15.
聚类分析是数据挖掘的一个重要运用方法,它是一个把数据对象划分成子集的过程.k-means算法是一个基于划分且应用非常广泛的聚类算法,具有原理简单、便于理解和实现、能处理大数据集等优点.但是,该算法也存在着一些不可避免的缺点,本论述针对在多维空间k-means算法中聚类数需要事先给定以及该算法对初始中心点选取的敏感性这两方面的缺点给出了改进算法,并选取数据集对改进算法进行试验.结果表明笔者提出的改进算法比传统的k-means算法和基于最大最小距离算法的k-means聚类算法具有更高的有效性和稳定性.  相似文献   

16.
对于数量较大、维度较多、较为复杂的聚类对象,系统聚类较为复杂; 而模糊综合评判聚类方法聚类结果不够准确,其个数难以控制。为此,提出基于模糊综合评判的系统聚类算法,该方法对较为复杂的、由多种因素制约的事物或对象进行模糊综合评判处理,提取对象的整体特征,运用系统聚类对其进行聚类分析。最后通过对5 个班级的多次考试成绩进行了聚类分析,验证了该算法的有效性。实验结果表明,该方法具有准确性、整体性、可操作性以及简略性等。  相似文献   

17.
提出了一种自适应于不同题材文本自动确定其包含的潜在主题数K的方法.考虑到大多数文本的潜在主题分布符合段落密度特性,提出以段落为中心的研究策略,通过采用基于K均值的聚类算法联同自定义判别函数的聚类分析方法,实现了段落自适应聚类下的文本潜在主题的自动发现.实验结果表明,该方法在一定程度上能有效处理普遍存在的文风自由且主题表达灵活多样的各式文本.  相似文献   

18.
K-means聚类分析算法中一个新的确定聚类个数有效性的指标   总被引:11,自引:0,他引:11  
K-means 算法是聚类分析中使用最为广泛的算法之一.然而,该算法通常受到初始聚类条件的影响.关于这个问题的详细讨论可参看文献[1].该算法的另一个不足之处是,聚类数目K必须作为参数由用户提供.笔者提出了一个新的有关聚类有效性的度量指标和优化的K-means 算法.它能自动确定最佳聚类个数.  相似文献   

19.
基于遗传算法的聚类分析及其应用   总被引:12,自引:0,他引:12  
通过把C-均值法中的距离平方和准则函数作为遗传算法的适应度函数,把各个聚类中心编码成染色体,来讨论一种基于遗传算法的聚类分析方法,目的是利用遗传算法的全局性来提高聚类算法找到全局最优的可能性。实验结果证明,该算法可以很好地解决某些聚类分析问题。  相似文献   

20.
模糊c均值聚类在交通流高峰期确定中的应用   总被引:1,自引:0,他引:1  
交通流高峰期是交通规划、交通控制中一个非常重要的概念.目前高峰期一般是凭经验人为确定的.文章利用模糊c均值聚类方法对交通流高峰期的确定问题进行研究.首先对模糊c均值聚类算法进行简要介绍,然后利用该算法对某城间高速公路交通流数据进行聚类分析,分别确定了该高速公路正、反向交通流的高峰期.结果表明,该算法聚类结果与经验交通流高峰期基本一致.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号