首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
聚类分析作为数据挖掘中一个重要的组成部分,主要用于在潜在的数据中发现有价值的数据分布和数据模式。在研究基本蚁群聚类模型、信息熵以及LF算法和K-means算法的基础上,提出了一种蚁群聚类组合算法策略。  相似文献   

2.
K-means算法普遍应用在数据聚类分析,然而K-means算法具有不稳定性等缺陷,缺乏有效的降维能力,面对大量高维体检数据时聚类效果不佳.针对该问题,文中提出了一种基于FOA与Autoencoder的聚类改进算法,将K-means算法和Autoencoder模型结合,使用Antoencoder进行数据降维,并采用变步长果蝇优化算法的变减步长策略对Autoencoder的权重和偏移初始化方法进行改进.该算法可提高对健康体检数据聚类分析的准确度和效率,聚类轮廓系数也大幅提升,该算法应用于居民健康状况分析、疾病预测等方面表现出了较高的效率.  相似文献   

3.
针对传统阴阳k-means算法未利用数据结构导致计算效率较低的问题, 提出一种高效阴阳k-means聚类算法. 该算法根据数据相似性将原始数据进行逐层分解, 并建立满m叉树结构存储各层数据, 以树结构各叶子节点中存储的数据信息建立加权数据, 运行加权阴阳k-means算法得到收敛中心. 在原始数据中以加权数据收敛中心为初始化条件运行传统阴阳k-means算法进一步优化目标函数值. 在5组UCI数据集上与k-means、传统阴阳k-means及另外两种加速算法进行对比实验, 实验结果表明, 该算法具有较高的加速比, 且求解精度与传统阴阳k-means聚类基本相同.  相似文献   

4.
本文首先简单阐述了蚁群算法及其发展,接着在蚁群算法的聚类分析概念基础上,联系国内外研究与应用,介绍了蚁群算法的聚类应用,着重说明了蚁群算法用于聚类的方向,最后总结了带聚类处理的蚁群算法的研究和应用的可能方向。  相似文献   

5.
在数据挖掘的实现过程中,聚类分析已经成为数据挖掘研究领域中一个非常活跃的研究课题。聚类是数据挖掘中一种重要的挖掘方法,它从数据库中计算发现数据中隐舍的有用信息或知识,数据聚类在很多领域中有着广泛的应用。该文研究的主要内容是数据聚类算法在Web数据挖掘中的应用,获得的聚类结果可以作为web网站结构的优化,站点的重构以及个性化的服务和推荐的重要依据。  相似文献   

6.
针对传统K均值聚类算法对初始聚类中心敏感,易陷入局部最优和对大数据集聚类速度慢的缺点,将ARIA与Kmeans算法相结合,提出了一种ARIA-Kmeans算法,即基于自适应半径免疫的K均值聚类算法。首先利用自适应半径免疫算法对数据进行预处理,产生能够代表原始数据分布以及密度信息的内部镜像数据;然后用K均值聚类算法对其进行多次聚类,获得最佳聚类中心,并将其作为初始聚类中心,推广到全部数据优化聚类效果;最后对其结果进行评价。实验结果表明,相对于传统Kmeans算法,新算法在保证聚类准确度的前提下,提高了算法运行的时间效率和稳定性。  相似文献   

7.
针对大规模旅行商问题具有区域分布的族类特征,采用最小方差法将城市样本点聚成k个城市群,利用蚁群算法,求出每个城市群内部城市的最短路径及城市群之间的最短路径.提出了一种新的城市群连接方式及标记方法,使得从任一个城市出发,以该方式可对每个城市群的连接城市进行标记,同时,利用循环搜索的方法可得到每个城市群的连接方式,最终得到全局最短路径的一个满意解.最后利用TSPLIB提供的实验数据,对算法的正确性进行了验证.  相似文献   

8.
改进的基于层次聚类的模糊聚类算法   总被引:1,自引:1,他引:0  
针对FCM算法的缺陷,文章提出了一种基于层次聚类的模糊聚类算法(HFCM)。该算法采用凝聚的层次聚类方法,可快速地发现高度聚集的数据区域,并对这些高密度区域进一步进行分析与合并,通过评估函数的评估,找到最优的聚类方案。试验结果表明,该算法具有较高的分类精确度和较高的排除噪声的能力。  相似文献   

9.
本文介绍了现有的蚁群聚类算法,在此基础上进行改进,又利用信息熵减少参数设置,提高聚类性能,并且通过仿真实验实现了数据集的聚类。结果表明,新算法能加快聚类速度,得到较好的聚类结果。  相似文献   

10.
黄金花 《科技信息》2008,(13):254-254
本文介绍了聚类算法基本原理以及各种常用的聚类算法,并比较分析了几种典型聚类算法的优点与不足。以便于对聚类算法作进一步的研究。  相似文献   

11.
算法性能分析技术研究   总被引:1,自引:1,他引:0  
文章论述了算法性能分析的基本理论,分析了一个典型的算法分析实例,提出了几种用于算法分析的技术,解决了一大类算法性能分析的问题。  相似文献   

12.
文章论述了算法性能分析的基本理论,分析了一个典型的算法分析买例,提出了儿种用于算法分析的技术,解决了一大类算法性能分析的问题。  相似文献   

13.
为了充分利用计算机资源,通过对于高阶矩阵乘法的串行与并行运算结果的比较得出并行算法的明显优势,提出在大规模的工程与数学运算中应充分利用多处理机并行执行的特点来提高机器的性能与程序的运行效率的结论。  相似文献   

14.
数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术.通过对数据挖掘决策树算法和未成年犯罪人员行为数据进行分析,找出其中潜在的规则为相关部门决策提供理论的支持.  相似文献   

15.
本文证明了存在一个图G 使得它的直径与其n-次团图K~n(G)的直径满足关系。diamK~n(G)=diamG n其中n≥1为整数,这就是所谓PRS-猜想。  相似文献   

16.
提出了一种基于相对熵和子空间二次过滤的CLIQUE改进算法。该算法根据数据的分布情况对每一维采用自适应的网格划分方法,减少了全空间中网格单元的数量,降低了算法的时间复杂度。算法采用了基于维关联度的子空间二次过滤策略,提高了聚类结果的准确性。实验使用仿真数据表明,该算法在精度,时间复杂性等方面的表现优越。  相似文献   

17.
针对员工离职会增加企业运营成本,降低企业盈利能力的问题,提出使用机器学习的离职员工预测算法;通过Stacking集成学习算法组合Adaboost和Random Forest基本算法构建LRA预测模型,实现对某企业的员工离职预测;实验结果显示,LRA模型的预测准确率为89. 09%,相对于单一算法所构建验证的模型预测准确率明显提高,LRA模型的查准率、查全率以及F1度量指标证实模型的可行性与可靠性,通过对输入LRA模型的特征进行重要性排序,得到影响员工离职的主要因素有加班、工龄(0-3年)、收入、职业级别等,丰富已有研究的结论,有利于企业决策者,针对离职行为进行合理决策。  相似文献   

18.
关于时序模式发现算法的研究   总被引:1,自引:1,他引:0  
数据挖掘归属于决策系统,可以从浩瀚的数据库中挖掘出不易被发现的有用信息,并且可以进行预测,为管理层中决策者的决策提供科学依据。针对时序数据中的复杂模式问题,提出了一种时序模式算法,并描绘了算法的基本思想及给出了算法的简单伪代码。在用程序实现后,对算法的优劣进行了分析,为进一步改进和完善算法或者为寻找更为理想的算法提供了有益的启示。  相似文献   

19.
设G=(V,E)是一个有限无向简单图,C_k是G中具有k个点的完备子图的数目。序列(C_1,C_2,…)称为图G的团序列。本文给出了整数序列是弦图的团序列的充分必要条件、两个弦图有相同的团序列的充分必要条件和弦图k连通的充分必要条件。  相似文献   

20.
分词是中文信息处理的基础,词典查询又是分词的基础。另外,搜索引擎需要对访问过的URL进行唯一性检测。针对汉语词典查询和唯一性检测这两个问题,提出Dynamic Hash TRIE词典算法,有效地压缩了节点,没有单链树枝。通过Java和C++编程实验,对比了多个同类算法,证明该算法对于中文词典具有较高的查询性能,灵活的可拓展性。另外还提出了一个词库测试的标准Norm Test,可以排除机器性能的干扰来对比各种算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号