首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
K—means聚类算法在客户细分中的应用   总被引:2,自引:0,他引:2  
以某超市会员为研究对象,以其会员卡的消费记录为数据源,运用K-means聚类算法对该超市VIP客户进行细分,得到一个细分模型,该模型对企业营销策略的制定具有一定的辅助作用.  相似文献   

2.
依据图书馆的现有信息,结合数据挖掘的流行方向,应用聚类算法分析研究读者的借阅行为,获得对图书馆管理有用的信息,提高图书馆管理工作效率和资源利用率。  相似文献   

3.
K—means聚类算法的研究   总被引:5,自引:0,他引:5  
为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法.采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初始聚类中心后,对初值进行数据标准化处理.将改进的K-means算法应用于销售行业,结果显示,改进后的算法比原始的算法在效率上得到了提高.  相似文献   

4.
在数据挖掘的实现过程中,聚类分析已经成为数据挖掘研究领域中一个非常活跃的研究课题。聚类是数据挖掘中一种重要的挖掘方法,它从数据库中计算发现数据中隐舍的有用信息或知识,数据聚类在很多领域中有着广泛的应用。该文研究的主要内容是数据聚类算法在Web数据挖掘中的应用,获得的聚类结果可以作为web网站结构的优化,站点的重构以及个性化的服务和推荐的重要依据。  相似文献   

5.
为解决模糊层次聚类算法无法收敛的问题,提出一种改进的模糊层次聚类算法.算法在分群前先进行数据处理,将特征向量相同的群合并成一个新的群,再使用模糊层次聚类算法分群,最后使用K-means算法将类簇收敛为想要的数量.实验结果表明,本算法具有较好的稳定性和分群效果,聚类质量高.  相似文献   

6.
传统K-means 算法对于聚类初始点的选取和距离度量的计算异常敏感,因而很可能导致K-means 算法只能收敛得到局部最优解。为此,提出一种改进的K-means 算法,即K-means 聚类算法最优匹配算法,并进行了相关的算法实验分析。该改进算法首先对传统的K-means 聚类算法进行初始点的选取,并分析聚类结果。然后,分别从初始聚类中心的选择和距离算法的确定进行实验测试,引入轮廓系数评价聚类效果,分析实验结果可知,K-means 聚类算法最优匹配算法具有较好的稳定性和较高的聚类准确率。  相似文献   

7.
文本聚类算法的比较   总被引:3,自引:0,他引:3  
聚类是一种重要的数据挖掘形式。介绍了常用的文本聚类算法,从各种聚类算法的适用范围、初始参数的影响、终止条件以及对噪声的敏感性等方面对其进行了分析比较。  相似文献   

8.
K-means 是一种基于划分的聚类算法,由于 K-means 算法在选择初始聚类中心时是随机选取 k 个点,因此一旦 k 个点选取不合理,将会误导聚类过程,得到一个不合理的聚类结果。在分析聚类结果对初值依赖性的基础上,对初值选取方法进行了分析和研究,采取“射靶”的原理进行类中心搜索。从实验结果中可以发现,改进后 K-means 得到的聚类结果更加稳定,对初始聚类中心的依赖性减弱了。  相似文献   

9.
K-means聚类算法是近年来数据挖掘学科的一个研究热点和重点,该算法是基于划分的聚类分析算法.目前这种算法在聚类分析中得到了广泛应用。本文将介绍K-means聚类算法的主要思想,及其优缺点。针对该算法经常陷入局部最优,以及对孤立点敏感等缺点,提出了一种基于模拟退火算法的方法对其进行优化,可以有效地防止该算法陷入局部最优的情况。  相似文献   

10.
王娟 《科技信息》2012,(25):168+229-168,229
聚类算法作为一种重要的数据挖掘的方法,能找到样本中相对集中的区域。本文分析了一些常用聚类算法以及局限性,并且针对K-means算法中初始点的选择,讨论了一种改进的K-means算法的实现过程,以期得到比较理想的聚类效果。  相似文献   

11.
一个基于K-means的聚类算法的实现   总被引:9,自引:0,他引:9  
聚类算法作为数据挖掘中的一种分析方法,它能找到样本比较密集的部分,并且概括出样本相对比较集中的区域.分析了传统的聚类算法及局限性,讨论了一个基于K-mealls算法的实现过程,使得算法可处理存在孤立点的大文档集,得到最佳的聚类结果。  相似文献   

12.
原始的k-means算法是从样本点的集合中随机选取K个中心,这种选取具有盲目性和随意性,它在很大程度上决定了算法的有效性.为消除选取初始中心的盲目性,应充分利用已有数据样本点的信息.采取对数据进行预处理的方式来选取初始中心.实验证明新的初始点的选取不仅提高了算法的计算效率,也提高了算法最终确定的聚类的精度.  相似文献   

13.
在现代信息化社会中,对企业而言,数据的有效利用不仅有助于发现业务发展的趋势,而且可以帮助企业做出正确的决策,使企业处于更有利的竞争位置。文章结合数据挖掘技术在企业中的应用,提出选择数据挖掘技术的两个重要依据,以便开发出有效、实用的数据挖掘系统。  相似文献   

14.
阐述了入侵检测和数据挖掘技术,并介绍了数据挖掘技术在入侵检测系统中的应用。  相似文献   

15.
基于数据挖掘平台的模糊聚类算法及应用研究   总被引:3,自引:0,他引:3  
研究基于目标函数的模糊聚类算法,并对聚类效果的有效性和参数选择进行了详细分析,在数据挖掘平台中实现该算法,通过设置聚类误差和实时误差两项动态指标来确定最佳的判别方法和参数设置.最后将该算法应用于模型生命表制作的前期分析工作中。  相似文献   

16.
论数据挖掘技术的发展前景及应用   总被引:2,自引:0,他引:2  
数据挖掘是数据库最活跃的领域之一,本文不仅系统的介绍了数据挖掘技术的发展背景、数据挖掘的概念和特点、数据挖掘的功能和过程,而且对数据挖掘的局限性也进行了研究和探讨,最后总结了数据挖掘现状并且提出了数据挖掘的发展方向.  相似文献   

17.
讨论了K-means聚类分析在人体体型分类应用时分类数的确定方法和迭代收敛两个重要问题.参考GB/T 1335—2008,以219名青年女性人体数据为检验样本,以胸腰差为实例进行论证.结果表明:采用基于系统聚类的距离评价函数法,样本最佳分类数为7类,如限制分类数为3~5时,则最优分类数为4;抽取容量分别为219和100的两组样本进行不同迭代次数的聚类分析,发现聚类收敛所需的迭代次数受数据离散程度影响,采用SPSS软件进行聚类分析时应该设定较大的迭代次数以确保聚类收敛.  相似文献   

18.
针对传统K-均值方法不能有效处理动态变化的数据聚类的问题,本文提出了一种改进的数据流聚类技术——流式K-均值聚类(Streaming K-means Clustering,SKC).该方法首先对数据流中已经产生的初始数据块进行K-均值聚类,当数据流的新数据块到来时,通过衡量已经得到的聚类结果与新进入样本块的距离,对样本进行初步简单归类,并计算聚类结果的性能,若聚类结果性能在可接受范围内,则该数据块聚类结束,否则采用K-均值方法对新类进行深层次聚类.采用SKC的流式数据聚类方法处理数据流的聚类问题,对于整个数据流中的多数数据块都进行简单归类,只有少数数据块进行K-均值聚类,有效提高了数据流聚类的效率.实验结果表明,流式K-均值聚类方法能够有效处理数据流的聚类问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号