共查询到20条相似文献,搜索用时 0 毫秒
1.
改进的基于层次聚类的模糊聚类算法 总被引:1,自引:1,他引:0
针对FCM算法的缺陷,文章提出了一种基于层次聚类的模糊聚类算法(HFCM)。该算法采用凝聚的层次聚类方法,可快速地发现高度聚集的数据区域,并对这些高密度区域进一步进行分析与合并,通过评估函数的评估,找到最优的聚类方案。试验结果表明,该算法具有较高的分类精确度和较高的排除噪声的能力。 相似文献
2.
层次聚类分析法在甘肃省临夏回族自治州土地利用分区中的应用 总被引:4,自引:0,他引:4
以甘肃省临夏州为研究对象,构建了土地利用分区指标体系;对指标体系表进行赋值,并对数据进行标准化处理;将标准化后的数据作为基础数据,利用SPSS13.0的层次聚类分析功能对临夏州目前的土地利用情况进行定量化分类;在兼顾乡级行政界线完整和区域连续性以及临夏州日后社会经济发展要求的基础上对分类结果进行调整,得到最终的分区方案,并提出差异化调控政策. 相似文献
3.
层次聚类方法及其在气候跃变分析中的应用 总被引:1,自引:0,他引:1
针对经典气候跃变分析方法的存在的不足,并对有序样品的聚类方法引入统计显著性检验后,得到了一种研究气候跃变的层次聚类方法,此方法具有算法简单,统计意义明显,能获得不同层次上的跃变点的特点,应用此方法对北半球,云南省的昆明,蒙古,沾益进行了多层次的气候跃变研究,获得了一些有意义的结论。 相似文献
4.
分层次教学的模糊聚类分组模型 总被引:1,自引:0,他引:1
模糊聚类分析广泛应用在气象预报、地质、农业、林业等方面。本文基于分层次教学策略和模糊聚类分析理论对数学科学学院2010级数学与应用数学专业学生入学成绩进行分析,构建分层次教学的模糊聚类分组模型,并提出分层次教学的模糊聚类分组模型,最后对分层次教学的模糊聚类分组模型进行评价。 相似文献
5.
提出一种基于C-均值聚类的二层次人像聚类算法,解决了传统硬聚类中由于每个数据只能属于某一类而使得处于类边界的数据在检索时结果准确度不高, 以及对高维大数据量数据分类时存在的模糊聚类时间和空间复杂性过大等问题. 该算法为大规模人像数据库检索提供了一种可行的分类方法, 使得分类后的人像数据在有效提高检索速度的同时保证了检索的准确度. 相似文献
6.
层次聚类算法是运行复杂度较高的聚类算法,基于不相似性测度的层次聚类算法不适合稀疏高维数据.结合核函数特点,提出了一种基于核函数的层次聚类算法.利用该算法,对稀疏高维数据进行了层次聚类对比,实验结果表明,该算法提高了层次聚类的准确率. 相似文献
7.
为了便于用户浏览网页信息,基于全置信度关联分析,提出了一种网页层次聚类的方法。该方法采用向量空间模型表示网页文档,将文档看成事务,文档的词汇视为事务中的项,根据关联挖掘算法发现文档之间的强关联规则产生基本类,然后利用图划分的算法完成网页文档的层次聚类。在关联规则产生过程中采用全置信度量发现强关联模式,规则的产生不受支持度阈值设置的影响,即使支持度闽值设置为零,也能发现强关联模式,有效地消除了弱相关的交叉支持模式。 相似文献
8.
几千年来,中医药领域的无数临床实践与理论研究积累了很多对哮喘病的治疗方剂,已有的基于距离的聚类算法在对哮喘方剂数据的聚类上不太有效.根据哮喘药方数据集高维稀疏性的特点提出一种基于最大频繁项集的层次聚类算法,此算法在哮喘方剂的聚类上取得了较好的效果.基于现有中药数据,设计并实现一个中药方剂数据挖掘平台,该平台将中药数据检索功能和中药数据挖掘功能集成起来,带来了极大的便利. 相似文献
9.
一种基于网格的层次聚类算法 总被引:1,自引:0,他引:1
传统的凝聚层次聚类算法的时间复杂度为O(n3),由于时间复杂度太高而无法应用到大的数据集.针对这一问题,提出了一种新的基于网格的层次聚类算法,先用基于网格的方法进行一次微聚类,然后再用凝聚的层次聚类算法进行聚类.在进行凝聚的层次聚类时,提出了一种新的簇间距离度量方法,该方法采用簇中权值最高的代表点的最小距离作为簇间的距离.理论分析和实验结果表明,基于网格的层次聚类算法比传统的凝聚层次算法具有更高的效率和正确性. 相似文献
10.
基于凝聚层次聚类的co-location模式挖掘 总被引:1,自引:0,他引:1
空间的co-location模式代表一组空间对象的子集,它们的实例在空间中频繁地关联,它是空间数据挖掘的重要研究方向.本文首先介绍co-location模式挖掘的基本算法,然后提出一种新的挖掘算法,算法先对空间数据进行凝聚层次聚类,在聚类结果上挖掘co-location模式,最后对这种新的算法作实验评估. 相似文献
11.
一种基于层次聚类的流数据挖掘方法 总被引:1,自引:0,他引:1
单劲松 《太原师范学院学报(自然科学版)》2008,7(4):72-74
流数据的特点在于数据流快速、有序地到达,并且数据海量,许多应用领域中生成的数据都可以归结为此类型.数据挖掘技术可以从海量的数据中发现有意义的知识模型,传统的数据挖掘算法通常是针对静态数据集,对流数据却无法有效地处理.文章试图从层次聚类角度处理流数据,并探讨了一种基于最小代价函数的层次聚类算法. 相似文献
12.
随着生物信息技术的快速发展,基因表达数据的规模急剧增长,这给传统的基因表达数据聚类算法带来了严峻的挑战.基于密度的层次聚类(DHC)能够较好地解决基因表达数据嵌套类问题且鲁棒性较好,但处理海量数据的效率不高.为此,提出了基于MapReduce的密度层次聚类算法——DisDHC.该算法首先进行数据分割,在每个子集上利用DHC进行聚类获得稀疏化的数据;在此基础上再次进行DHC聚类;最终产生整体数据的密度中心点.在酵母数据集、酵母细胞周期数据集、人血清数据集上进行实验,结果表明,DisDHC算法在保持DHC聚类效果的同时,极大地缩短了聚类时间. 相似文献
13.
提出一种新的聚类算法——层次谱聚类算法.该算法在传统二分的SM谱聚类的过程中嵌入了层次聚类算法,目的是为了提高谱聚类的聚类正确率,同时又利用谱聚类纠正了层次聚类过程中所得到的歪斜划分.实验结果表明:提出的层次谱聚类算法的聚类正确率比层次聚类算法、谱聚类算法的聚类正确率都要高,同时又纠正了层次聚类过程中的歪斜划分. 相似文献
14.
一种基于矩阵变换的层次聚类算法 总被引:1,自引:0,他引:1
针对K-means算法需预先确定聚类数的缺陷,提出一种基于矩阵变换的层次聚类(NHC)算法,通过对矩阵行列的排序、变换,把矩阵分块成子矩阵聚类,以熵作为评价聚类结果标准.实验表明,NHC算法的执行效率和聚类精度高于传统的HCM(hard C-means)算法. 相似文献
15.
何振峰 《福州大学学报(自然科学版)》2005,33(5):574-579
分析了CCL算法,基于数据对象间的关联限制定义了类间关联系数,提出了一种混合型限制层次聚类算法HCCL.本算法可以分成2个相对独立的阶段,第一阶段同Complete-link算法几乎一致,依据数据对象的自然分布,把它们合并入一个个小类;在第二阶段,依据背景知识,基于类间关联系数来实现小类的进一步合并,近邻信息辅助决策.实验结果表明,HCCL较CCL更为稳定,总体上能更有效地利用所给的关联限制. 相似文献
16.
使用隐狄利克雷分布(LDA)进行话题检测时,话题模型产生的话题存在语义上的分层现象;LDA建模产生的话题会出现语义上概括较广的泛话题;话题数目超参数K的设定通常根据人的经验.这些将造成建模结果出现包含多个子话题的混合话题情况.针对上述问题,文中基于层次聚类算法,使用一种文档特征词序列对LDA模型分类结果粒度过粗、热点话题检测结果泛化所导致的舆情监控价值较低的情况进行子话题检测.首先对LDA模型建模结果进行优化,对话题-单词分布与文档-单词分布两个矩阵进行过滤;然后对重叠话题进行检测与合并,采用文档间紧密度度量方式发现泛话题与混合话题;最后通过层次聚类算法对话题下的文本进行二次聚类,得到话题下的子话题.实验结果表明:该算法对子话题的检测能够在更深层次上体现出热点话题的特性,便于舆情监控分析;与Single-Pass算法和K-均值聚类算法相比,该算法获得的结果更具有有效性;K的选取策略对基于层次聚类的子话题检测算法具有鲁棒性. 相似文献
17.
基于优化层次聚类的文档逻辑结构抽取 总被引:1,自引:0,他引:1
半结构化文档的逻辑结构自动发现可以改善文档的浏览方式,提高文档内容构件的复用性,有效克服了半结构化文档难于利用的弱点。该文将文档处理对象扩展到结构松散的文档实例,提出了基于优化层次聚类的文档逻辑结构抽取算法——CEDLS。算法首先对文档逻辑结构标志性信息进行识别与特征提取,并根据逻辑结构抽取的特点对传统的层次聚类分析方法进行改进,使获得的分类结果适用于CEDLS算法的逻辑层次归纳策略。最终以上海证券所的年报为测试集进行实验,通过与传统的方法进行比较,证明了这种算法在容错性能和正确率方面的优越性。 相似文献
18.
潘大庆 《广西民族大学学报》2012,18(4):56-59
针对微博对社会舆情影响力日趋增大,设计了基于层次聚类的微博敏感话题检测算法,通过对微博内容的自动抓取,利用层次聚类算法实现对微博内容的智能识别,并以敏感话题为单位对微博内容进行分类.重点对层次聚类算法的实现过程进行研究,引入了词频、词性等关键参数因子,提高层次聚类算法分类精度.通过测试表明,检测算法的检测分类精度为95.3%,话题误判率不超过6%. 相似文献
19.
对层次聚类算法的改进 总被引:5,自引:0,他引:5
介绍了层次聚类算法的基本思想,在原算法的基础上,通过对类间距离进行预排序从而避免合并类时重新计算类间距离,该算法降低了计算的复杂度.实验表明,改进后的算法在与原算法聚类效果相同的情况下运行速度明显提高. 相似文献
20.
聚类是数据挖掘中的关键问题,吸取了BIRCH算法中构造簇特征树来产生初始聚类中心的方法,提出了一种基于随机抽取的有限深度层次聚类算法(RSLDCH算法),采用随机抽取样本、限制特征树深度、构建叶子节点链表技术从而提高了算法的时间效率和聚类效果.实验表明,RSLDCH较BIRCH在运行速度和聚类效果上有一定的提高. 相似文献