首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
随机种子最近邻居搜索聚类算法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
提出了随机种子最近邻居搜索(RS-NNS)聚类算法,该算法从随机确定的种子开始沿着它最近邻居的方向搜索具有最大相似特征的邻居对象,形成局部最大聚类集合,并在搜索过程中动态调整数据对象的归属,以实现局部的最优分配,直到所有的数据对象完成聚类标识。经过验证,该算法可以适应数据集合的密度、形状、噪音、聚类个数等问题,并且相对于同类算法可以实现较快地优化搜索。  相似文献   

2.
一种基于广度优先搜索邻居的聚类算法   总被引:8,自引:0,他引:8  
聚类算法BFSN广度优先搜索某对象的直接邻居和间接邻居,对符合条件的所有找到的邻居合并,从而完成一类聚类.接着重复该步骤完成所有对象的聚类.与同类算法相比,该算法具有实现简单、复杂度低和容易设定最佳参数等优点.实验证明,在聚类正确率相近的情况下,该算法的效率比较高,而且能揭示同类对象之间的相异程度.  相似文献   

3.
针对经典粒子群(PSO)算法易出现早熟收敛和搜索精度差的缺陷,提出了一种基于混沌变异的k-均值聚类PSO优化算法(FCPSO).该算法首先通过k-均值聚类方法把粒子群分成若干个子群体,从而在迭代过程中每个粒子根据其个体极值和所在子种群中的全局极值来更新自己的位置和速度.其次,在算法中引入自适应混沌变异,有效的增强了子群体之间信息交换和经典PSO算法跳出局部最优解的能力.对几个典型可变维函数的测试结果表明,该算法是非常有效的.  相似文献   

4.
黄力明 《镇江高专学报》2000,13(4):69-71,85
基于对属性均值聚类算法和求解全局优化问题的方法的分析,提出了基于模拟退火算法的属性均值聚类算法。数值计算表明该算法是一个具有全局最优解的聚类方法。  相似文献   

5.
大矢量空间聚类的遗传k-均值算法   总被引:4,自引:0,他引:4  
基于遗传算法与k均值算法,提出了一种遗传k均值算法.该算法通过改进标准遗传操作和使用可变变异率,使其在大矢量空间聚类问题中表现良好的性能,克服了k均值聚类算法易于陷入局部最值和标准遗传交叉操作对聚类应用的不适应.为设计全局最优搜索方案提供了新思路  相似文献   

6.
针对传统K均值算法中采取的欧氏距离计算相似性的不足,提出一种新的相似性计算方法,并将这种方法与欧氏距离的度量方法进行了比较。在UC I基准数据集上的实验表明,该方法有更稳定的聚类结果,是一种比较有效的聚类度量方法。  相似文献   

7.
提出一种基于C-均值聚类的二层次人像聚类算法,解决了传统硬聚类中由于每个数据只能属于某一类而使得处于类边界的数据在检索时结果准确度不高, 以及对高维大数据量数据分类时存在的模糊聚类时间和空间复杂性过大等问题. 该算法为大规模人像数据库检索提供了一种可行的分类方法, 使得分类后的人像数据在有效提高检索速度的同时保证了检索的准确度.  相似文献   

8.
李晓瑜 《科技信息》2009,(14):19-19
网络的发展造成了大量信息涌入人们的视野。目前任意一款搜索引擎都不具备足够的智能化和个性化,无法满足所有人的需求。本文结合Multi-Agent系统,提出了一种新的搜索引擎的设计思路,能够更好地满足用户需求。  相似文献   

9.
针对传统K均值聚类算法对初始聚类中心敏感,易陷入局部最优和对大数据集聚类速度慢的缺点,将ARIA与Kmeans算法相结合,提出了一种ARIA-Kmeans算法,即基于自适应半径免疫的K均值聚类算法。首先利用自适应半径免疫算法对数据进行预处理,产生能够代表原始数据分布以及密度信息的内部镜像数据;然后用K均值聚类算法对其进行多次聚类,获得最佳聚类中心,并将其作为初始聚类中心,推广到全部数据优化聚类效果;最后对其结果进行评价。实验结果表明,相对于传统Kmeans算法,新算法在保证聚类准确度的前提下,提高了算法运行的时间效率和稳定性。  相似文献   

10.
模糊C-均值聚类算法(F(M)是很早的目标函数聚类算法,也是目标函数聚类算法中研究的比较充分的算法之一,FCM算法是一种基于划分的聚类算法,它的思想就是使得被划分到同一簇的对象之间相似度最大,而不同簇之间的相似度最小。此算法的缺点是当数据量非常庞大时,算法的运算过程就会非常耗时,甚至是无法完成运算。  相似文献   

11.
用k-means算法对二维数据进行聚类分析,并用C#语言实现了该算法。先按照样本点的距离进行初始划分,然后再按照各样本点和初始中点的距离远近进行聚类。结果表明,k-means算法对二维数据的聚类是有效的,实现该算法的程序对二维数据的聚类具有通用性。  相似文献   

12.
提出了一种改进的和声搜索算法并应用到聚类分析中.首先,将状态反馈机制引入到和声搜索算法中,通过判断和声记忆库中"最优"和声和"最差"和声之间的差异,来动态调整和声记忆库考虑概率和移动步长,使算法能够快速地收敛到全局最优解.通过更新和声向量中精度变量对应的聚类中心来最小化目标函数值,获得数据样本的最优划分.其次,提出了一种数据样本真实聚类中心数的确定方法,当输入样本数大于真实聚类中心数时,通过计算能够自动地确定数据样本真实聚类中心数目.最后,应用4种性能指标来比较所提算法与蚁群聚类算法和原始和声搜索聚类算法的性能.结果表明,所提算法的性能优于另两种算法.  相似文献   

13.
针对网格聚类方法在高维子空间聚类中网格规模随着维度急剧升高的问题,以及差别阈值方法引入干扰小聚簇的问题,提出一种具有两个网格划分阶段的密度意识子空间聚类模型。该模型第一阶段采用粗网格找出可能存在聚类的子空间区域,第二阶段在这些区域中进行等效精度更高的网格划分并找出所有致密单元。该模型在两个阶段处理的网格规模均远低于密度意识子空间聚类模型在相同划分精度下的网格规模,同时利用第一阶段对网格空间的筛选作用降低小聚簇干扰,提高聚类质量。合成数据集实验表明:该模型聚类精准率和查全率性能明显优于原模型;基于真实数据集实验,相比一次划分模型,该模型以损失0.4%数据点的代价提高输出聚类密度19.4%,聚类质量大幅提升。  相似文献   

14.
基于概念分组的Web搜索结果聚类算法   总被引:2,自引:0,他引:2  
为了便于用户浏览搜索引擎返回的搜索结果,快速有效地定位有价值的Web文档,提出了基于概念分组的Web搜索结果聚类算法.首先,建立特征词同现网络,利用概念分组技术挖掘特征词之间的语义关联,形成主题概念类;然后,计算文档与各概念类之间的距离,据此实现Web搜索结果的聚类;最后,综合考虑特征词在类内和文档集中的重要性进行类别标签的选择.实验结果表明本算法具有较好的聚类性能,明显优于k-均值算法,且产生的类别标签容易理解.  相似文献   

15.
在通常的聚类分析方法的基础上,提出了一种改进聚类分析方法,并运用于数据源中缺损数据的修补,案例示算结果显示,该方法比传统的数据预处理方法更合理,置信度更大。  相似文献   

16.
搜索引擎是目前最主要的WWW信息检索的工具 ,然而 ,用户对当前搜索引擎的检索效果并不满意。论文给出了基于文档文本内容和文档间超链信息的混合相似度计算方法,并给出了基于混合相似度的模糊(软 )聚类算法HTSC。对HTSC算法进行了理论分析 ,并对其中的核心算法进行了初步的实验验证。该算法可对搜索引擎返回的结果进行模糊聚类 ,以方便用户从中找到真正需要的信息。  相似文献   

17.
模糊聚类分析系统的研究与实现   总被引:1,自引:0,他引:1  
本文提出了一个在关系数据库中实现模糊聚类的模型系统,阐述了该系统实现聚类的方法和过程,对于如何减少噪声数据的干扰、提高聚类分析的有效性和增强算法的鲁棒性等方面,进行了研究和探索。  相似文献   

18.
一种基于密度的引力聚类算法   总被引:1,自引:0,他引:1  
针对传统基于距离的聚类算法所存在的缺点,将万有引力和牛顿第二运动定律思想引入到聚类过程中,提出了一种改进的基于密度的引力聚类算法GCABD.该算法可以自动决定目标数据集中的簇的个数,并且能发现任意形状的簇且可以过滤"噪声"数据.实验结果表明,所提出的GCABD算法的聚类效果和精度均比典型的K-means算法好,提高了聚类质量.  相似文献   

19.
针对如何快速有效地在信息管理系统中建立基于概念格模型的聚类分析进行研究,提出在数据库中保存格节点的概念格物理模型、最小基数格模型和最小基数格节点的生成方法,并用以解决产品间的快速比较、相近产品替代等问题.  相似文献   

20.
大数据下的系统发育估计是一个组合优化问题,在有限计算时间内,现有算法很难为大量序列数据的分析提供最优解.基于前人启发式算法,提出了一种系统发育树随机聚类建树方法,可在较短时间内为系统发育过程产生的大规模序列数据提供所有具有进化意义的解及最优解,以揭示发育过程中的序列进化关系.实验结果表明,该随机聚类方法是行之有效的,对生物计算及系统发育相关领域研究具有积极意义.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号