首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 8 毫秒
1.
孟岩  刘希玉  李镇 《山东科学》2007,20(5):48-52
针对模糊C-均值本文提出将基于蚁群算法的模糊聚类算法应用于文本聚类中,聚类采用二级结构,蚁群算法(ACA)作为一级结构,模糊C-均值聚类FCM用于二级结构。将此算法对文本集合进行聚类实验,并用分离系数、分离熵来判断模糊划分的效果,实验结果表明,与FCM相比,该算法具有较好的聚类效果。  相似文献   

2.
改进遗传算法在模糊文本聚类中的应用研究   总被引:1,自引:0,他引:1  
在分析了传统模糊聚类FCM算法和基于遗传聚类算法优点和不足的基础上,提出了一种基于免疫单亲遗传和模糊C均值的改进遗传聚类算法,克服了FCM的局部最优问题以及标准遗传算法聚类时的搜索速度和聚类精度的矛盾,并将该算法用于文本聚类,实验表明该算法是有效的。  相似文献   

3.
基于遗传算法的动态文本聚类   总被引:1,自引:0,他引:1  
为了解决动态文本聚类中聚类中心陷于局部极值点的问题,该文提出了基于遗传算法的动态文本聚类方法.采用二进制编码方式对聚类中心进行编码、类内中的点与其类中心的欧氏距离作为适应度函数.通过遗传算子的操作对类中心进行逐步迭代,直至适应度函数收敛,得到使聚类划分效果最好的聚类中心.实验表明该方法可以克服局部极值点的问题,且聚类结果的评价指标Purity(纯度)也比较好.  相似文献   

4.
设计了一种基于主题的Web文本聚类方法(HTBC):首先根据文本的标题和正文提取文本的主题词向量,然后通过训练文本集生成词聚类,并将每个主题词向量归类到其应属的词类,再将同属于一个词类的主题词向量对应的文本归并到用对应词类的名字代表的类,从而达到聚类的目的.算法分四个步骤:预处理、建立主题向量、生成词聚类和主题聚类.同时,对HTBC与STC、AHC、KMC算法从聚类的准确率和召回率上做了比较,实验结果表明,HTBC算法的准确率较STC、AHC和KMC算法要好.  相似文献   

5.
K-均值算法是文档聚类中常用的一种划分方法.近年来,为提高聚类质量,出现了不少优化初始中心的改进算法.该文在基于密度选择中心点算法的基础上,建立了相似度概率模型辅助密度参数的确定,有效减少了参数选择的盲目性.同时,该文提出一种二分快速确定K值最优解的方法.大量实验结果表明,该方法具有理想的效果.  相似文献   

6.
FCM算法应用于文本聚类时,由于初始聚类中心点选择的随机性,以及容易陷入局部最优的问题,导致文本聚类效果较差.为了提高FCM算法的聚类精度,提出了采用黑洞算法寻找FCM最优初始聚类中心的方法.黑洞算法是一种启发式优化方法,在FCM初始聚类中心寻优的过程中,始终保持黑洞为全局最优解,最终发现FCM的最优初始聚类中心.实验结果表明,基于黑洞算法的FCM文本聚类方法可以解决FCM算法对初始中心点敏感和容易陷入局部最优的问题,聚类精度明显提高.  相似文献   

7.
传统3DVM(3-Dimension Document Vector Model)由于没有使用新闻报道的时间因子,这使得该模型表示的新闻报道具有不准确性,进而影响新闻报道的聚类结果.本研究在三维文档向量模型的基础上加入了时间因子,提出了四维文档向量模型表示新闻报道.最后,用k-means聚类算法进行新闻报道的的无监督聚类.实例验证结果表明本文提出的4DVM和k-means相结合的聚类算法优于3DVM以及VSM(vector space mode)和k-means相结合的聚类算法.  相似文献   

8.
传统3DVM(3-Dimension Document Vector Model)由于没有使用新闻报道的时间因子,这使得该模型表示的新闻报道具有不准确性,进而影响新闻报道的聚类结果.本研究在三维文档向量模型的基础上加入了时间因子,提出了四维文档向量模型表示新闻报道.最后,用k-means聚类算法进行新闻报道的的无监督聚类.实例验证结果表明本文提出的4DVM和k-means相结合的聚类算法优于3DVM以及VSM(vector space mode)和k-means相结合的聚类算法.  相似文献   

9.
依据图书馆的现有信息,结合数据挖掘的流行方向,应用聚类算法分析研究读者的借阅行为,获得对图书馆管理有用的信息,提高图书馆管理工作效率和资源利用率。  相似文献   

10.
一种改进的k-means聚类算法在入侵检测中的应用   总被引:4,自引:0,他引:4  
讨论了经典的k-平均聚类算法,说明了它存在不能很好地处理符号数据和对噪声与孤立点数据敏感等不足,提出了一种改进的k-平均聚类算法,克服了k-平均聚类算法的缺点,并从理论上分析了该算法的复杂度。实验证明,用该方法实现的数据聚类与传统的基于平均值的方法相比较,能有效提高数据聚类效果以及入侵检测的准确度。  相似文献   

11.
提出了一种改进的和声搜索算法并应用到聚类分析中.首先,将状态反馈机制引入到和声搜索算法中,通过判断和声记忆库中"最优"和声和"最差"和声之间的差异,来动态调整和声记忆库考虑概率和移动步长,使算法能够快速地收敛到全局最优解.通过更新和声向量中精度变量对应的聚类中心来最小化目标函数值,获得数据样本的最优划分.其次,提出了一种数据样本真实聚类中心数的确定方法,当输入样本数大于真实聚类中心数时,通过计算能够自动地确定数据样本真实聚类中心数目.最后,应用4种性能指标来比较所提算法与蚁群聚类算法和原始和声搜索聚类算法的性能.结果表明,所提算法的性能优于另两种算法.  相似文献   

12.
改进k中值聚类及其应用   总被引:1,自引:0,他引:1  
文章对划分方法、层次聚类方法以及小波变换进行了介绍,并详细分析了划分方法和层次聚类方法中存在的不足,将划分方法和层次聚类方法相结合,各取所长,提出改进的中值聚类,该方法分别从相似性度量、初始聚类簇及其簇中心的获取两方面对原始的基于划分的聚类方法进行改进.通过在混合数据聚类以及图像分割中的具体应用,验证了本文算法聚类的有效性及适用性.其中,在图像分割应用中,由于数据量的大小直接与图像本身的大小相关,当处理大型图像时,考虑首先对图像进行小波变换,通过对低频信号进行层次聚类从而能够快速有效地获取初始的聚类簇及其中心.  相似文献   

13.
通过将粗糙集和模糊聚类算法相结合, 利用粗糙集中上近似集和下近似集的概念改进模糊聚类算法, 解决了模糊聚类边界不确定的问题, 得到了上近似集和下近似集的聚类结果, 从而实现更好的聚类, 改进算法可以处理边界问题和复杂数据问题. 将改进的粗糙集模糊聚类算法用于研究环糊精聚类, 并将聚类结果与K均值聚类分析算法、 模糊C均值聚类算法相比, 实验结果表明, 改进算法有较好的聚类效果.  相似文献   

14.
运用模糊C-均值(FCM)聚类算法对数字图书馆的图书借阅数据进行数据挖掘,并使用误判率交叉估计法验证挖掘过程的有效性.通过分析聚类挖掘结果,寻找到读者借阅图书的潜在规律,并对各类图书的借阅质量进行判断,以提高图书馆的图书利用率,进一步优化馆藏.  相似文献   

15.
为了研究不同治疗抑郁症的药物(利血平、开郁安神胶囊)对抑郁症的治疗效果,用SOM和K-Means相结合的方法对用药后的抑郁症大鼠DNA的芯片样本进行聚类。结果表明,将K-Means用于收敛后的SOM网络,不仅较好地解决了SOM在训练样本后边界不清的问题,也将样本的训练结果映射在二维,有利于对聚类结果的呈现。此外,改进的...  相似文献   

16.
核聚类算法及其在模式识别中的应用   总被引:1,自引:2,他引:1  
将核学习方法的思想和可能性聚类算法相结合,提出一种基于核的可能性聚类算法,使其能够对非超球体、含有噪音和孤立点的数据进行有效的聚类。将该方法用于模式识别中,仿真实验表明,基于核的可能性聚类算法比模糊C-均值算法以及可能性聚类算法具有更好的聚类效果,且算法能够很快地收敛。  相似文献   

17.
基于数据挖掘平台的模糊聚类算法及应用研究   总被引:3,自引:0,他引:3  
研究基于目标函数的模糊聚类算法,并对聚类效果的有效性和参数选择进行了详细分析,在数据挖掘平台中实现该算法,通过设置聚类误差和实时误差两项动态指标来确定最佳的判别方法和参数设置.最后将该算法应用于模型生命表制作的前期分析工作中。  相似文献   

18.
鉴于以往的结构面产状分组方法常存在算法复杂、聚类精度差及分组效率低的不足,提出了一种新型的融合模拟退火算法及K-means聚类(SAK)的结构面分组算法,该算法简单易实现.利用模拟退火算法的退火原理,对K-means算法聚类的结构面分组结果进行优化,以期克服K-means算法易受初始聚类中心影响的缺陷.计算机模拟生成的结构面数据的分析表明,所提方法相较于传统K-means算法具有明显优势.将该方法应用于重庆市三环高速公路兴隆隧道实测结构面的分组中,并与已有方法进行对比.结果表明:该方法不仅聚类精度高,而且迭代速度也较快,具有较强的工程实用性.  相似文献   

19.
为了解决传统K均值算法在处理大规模数据时的局限性,在近似K均值算法(AKM)基础之上,利用对聚类中心进行分类的思想,提出了快速近似K均值算法(FAKM).该算法舍去了在AKM聚类结果中只获得少数样本的聚类中心,并充分利用类内样本密集稳定的聚类中心,使得迭代过程中待聚类样本数和类别数逐步减少,达到了提高算法速度及精简聚类结果的目的.将FAKM算法运用于实际的图像检索系统中,实验结果表明,系统在检索准确率、检索时间和聚类时间方面都得到了很好的改善.  相似文献   

20.
用基于神经网的聚类算法对医疗诊断专家系统中的诊断分类进行了研究,具体描述了算法的实现方法,并在计算机上进行了模拟,模拟结果表明,该方法克服了传统上基于规则的专家系统的某些缺陷,在实际运用中是可行的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号