首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
为解决企业客户价值体现问题, 提出一种TFA客户细分改进模型, 以客户发展空间T、 购买频次F和平均购买额A为指标, 充分体现客户的价值和发展空间. 首先, 引入局部密度值ρ和信息熵H, 改进K-means聚类算法, 以优化传统K-means聚类方法初始聚类中心的选取问题;其次, 通过搭建机器学习框架, 对选取人工数据集及真实数据集进行聚类实验, 验证模型的有效性. 实验结果表明, 该模型能有效分类客户, 充分反映客户价值及其发展空间, 并通过改进聚类算法提升了算法效率.  相似文献   

2.
详细介绍了经典划分式聚类算法K-means的特点,针对该算法中"聚类中心难以确定"的不足提出"选择最优聚类质心"的改进方案,改进后的算法得到了可靠的聚类质心.最后,基于"中华网BBS"文本数据对改进后的算法进行验证、分析,并与经典K-means算法聚类结果进行对比,得到了更为理想的实验结果,表明算法可行有效.  相似文献   

3.
为了解决传统K-means算法对初始聚类中心敏感和聚类数目事先难以确定的问题,提出了一种改进的K-means算法。改进算法利用最大距离等分策略来选取初始聚类中心,并利用一种评价函数来自动确定聚类数,减少了算法结果对参数的依赖。将改进算法应用到某企业客户分类中时,为提高分类结果的表征性,提出了以客户最近购买时间(Recency)、购买频次(Frequency)、平均购买额(Average Monetary)和购买倾向(Trend)作为客户价值细分变量的RFAT(Recency,frequency,average monetary and trend)模型,对客户RFAT值进行了聚类分析,并提供了针对不同客户群的营销策略。实证研究表明,该文所提出的改进算法和模型可以有效地对企业客户进行分类,能充分反映客户的当前价值和增值潜能。  相似文献   

4.
对不平衡数据进行聚类分析时,K-means聚类方法可能会错误地将分布在较小区域类别中的样本划分到大区域类别中;谱聚类算法,虽然可以有效优化数据结构,并很好地识别不同形状的样本,但却难以处理大规模数据.针对这些问题,提出一种改进地标点采样的不平衡数据聚类算法.该算法首先对不平衡数据进行预聚类以获得初始类标签,然后基于数据密度对数据进行采样.在此基础上,通过对采样数据执行K-means聚类,并将聚类中心作为地标点,对数据进行谱聚类分析.实验结果显示,该方法在处理不平衡数据时,不仅能够有效提高样本的聚类准确率,而且能够保证聚类结果的稳定性和精度.  相似文献   

5.
K-means算法普遍应用在数据聚类分析,然而K-means算法具有不稳定性等缺陷,缺乏有效的降维能力,面对大量高维体检数据时聚类效果不佳.针对该问题,文中提出了一种基于FOA与Autoencoder的聚类改进算法,将K-means算法和Autoencoder模型结合,使用Antoencoder进行数据降维,并采用变步长果蝇优化算法的变减步长策略对Autoencoder的权重和偏移初始化方法进行改进.该算法可提高对健康体检数据聚类分析的准确度和效率,聚类轮廓系数也大幅提升,该算法应用于居民健康状况分析、疾病预测等方面表现出了较高的效率.  相似文献   

6.
K-means聚类算法具有实现简单、普及性强的优势,但存在聚类中心选取随意性强的劣势.文章提出增加一个密度变量的方式来选出合理的初始聚类中心,通过对校园网上热点话题聚类分析的实验,检验出改进K-means聚类算法聚类效果好.  相似文献   

7.
一种改进的K一均值聚类算法   总被引:2,自引:0,他引:2  
为了改进K-means聚类算法的不足,把混合粒子群优化算法引入到K-means聚类算法中,重新选取编码方式并构造适应度函数,在此基础上提出了一种改进的K-means聚类算法;通过两个经典数据集的测试,实验结果表明:改进的算法比K-means算法具有更好的全局寻优能力、更快的收敛速度,且其解的精度更高对初始聚类中心的敏感度降低.  相似文献   

8.
为提高K-means算法全局搜索能力,提升聚类效果,提出一种基于近似骨架和混合蛙跳算法的K-means方法。该方法首先利用经典的混合蛙跳算法取代K-means算法中原有迭代公式,获得更优秀的聚类结果;然后对获得的聚类结果,使用基于近似骨架和混合蛙跳算法的K-means算法不寻找聚类中心,而是直接对簇的划分进行修改。UCI数据集实验结果表明,使用改进的聚类算法获得的聚类结果,较其他算法结果更为优秀。最后将改进后的聚类算法应用到医学眼底病历图像中,可以得到较好的血管切割效果。  相似文献   

9.
将K-means聚类算法在对事物分类中的优点用于判断变压器的故障中.并针对K-means聚类法在给定初始聚类中心不良的问题上进行改进.将改进的K-means聚类算法与三比值法相结合,以此来诊断变压器的多种常见故障.应用MATLAB分别对改进前后的K-means算法进行仿真,并将改进后的仿真结果同改进前K-means聚类算法的结果进行对比分析.结果表明,改进的K-means聚类算法不但能精确、有效地对变压器故障进行诊断,并且改进的K-means聚类法使仿真结果更加准确可靠.  相似文献   

10.
杨莉云  颜远海 《河南科学》2019,37(4):507-513
孤立点的存在使聚类中心的计算产生较大误差,影响K-means算法的聚类效果.针对该问题,引入谢林模型,使孤立点能够自动移动到其邻居所在位置,消除孤立点,同时,对K-means算法过程中的距离计算、初始聚类中心选取环节进行改进,提出基于孤立点自适应的K-means算法.该算法首先对原始数据进行归一化处理,以提高距离计算的准确性;然后,根据谢林模型的基本思想,将孤立点移动到其最近的多邻邻居;接着,由类簇的数目确定邻居样本的搜索范围,确定初始聚类中心;最后,根据移动后的数据集和初始聚类中心,进行K-means聚类.在UCI机器学习数据库中经典聚类数据集上的实验结果表明,该算法可显著提升聚类的精度,同时,簇的内聚性也比较好.  相似文献   

11.
针对K-均值聚类算法存在的缺陷,将改进的粒子群优化算法———智能单粒子优化算法(ISPO)应用到聚类分析当中来,提出一种混合聚类算法ISPO+K-means.该算法分为两个阶段:第一阶段利用ISPO算法较强的全局寻优能力形成初始聚类,第二阶段将初始聚类结果通过K-means算法形成最终聚类结果输出.与K-均值聚类算法和...  相似文献   

12.
通过研究聚类分析技术中的K-means算法,对其初始聚类中心的选择方法进行改进,并将改进后的K-means算法应用到高校师范生教学技能考核评价系统中,充分利用高等师范院校积累的教学技能考核数据,从而有效提高师范专业学生教学技能水平.  相似文献   

13.
K-means聚类算法是近年来数据挖掘学科的一个研究热点和重点,该算法是基于划分的聚类分析算法.目前这种算法在聚类分析中得到了广泛应用。本文将介绍K-means聚类算法的主要思想,及其优缺点。针对该算法经常陷入局部最优,以及对孤立点敏感等缺点,提出了一种基于模拟退火算法的方法对其进行优化,可以有效地防止该算法陷入局部最优的情况。  相似文献   

14.
K-means算法以硬聚类划分思想被广泛应用于入侵检测系统,这种严格的边界划分方法在对许多新衍生类入侵数据检测时,易出现检测率低、误检率高的情况。同时,当处理复杂网络访问数据时,采用固定的k值不够灵活,也影响检测的准确性。结合三支决策思想,对传统K-means算法进行了改进,提出了基于三支动态阈值K-means聚类的入侵检测算法。该算法通过动态阈值调整,可以优化聚类的数量,在一定程度上消除了固定k值对入侵检测效果的影响。将离群的不确定性网络数据进行分离和延迟判断,通过二次聚类重新划分后再做决策。在KDD Cup99数据集上实验结果表明,当攻击类型逐渐增多、攻击行为更加复杂时,改进后的K-means算法在检测率和误检率上显著优于传统K-means算法。  相似文献   

15.
为解决高多元时间序列聚类算法的问题,采用了一种基于主元分析方法的多元时间序列聚类分析方法,利用MTS序列的前z个主元与每个簇的代表元素之间的Eros距离,将原有的复杂数据降维.在此基础上通过改进K-means算法对选取的多元时间序列的主元进行聚类分析,最后得到K个MTS聚类.理论分析和实验结果表明该算法能有效解决聚类问题.  相似文献   

16.
建立快速有效的针对大规模文本数据的聚类分析方法是当前数据挖掘研究和应用领域中的一个热点问题.为了同时保证聚类效果和提高聚类效率,提出基于"互为最小相似度文本对"搜索的文本聚类算法及分布式并行计算模型.首先利用向量空间模型提出一种文本相似度计算方法;其次,基于"互为最小相似度文本对"搜索选择二分簇中心,提出通过一次划分实现簇质心寻优的二分K-means聚类算法;最后,基于MapReduce框架设计面向云计算应用的大规模文本并行聚类模型.在Hadoop平台上运用真实文本数据的实验表明:提出的聚类算法与原始二分K-means相比,在获得相当聚类效果的同时,具有明显效率优势;并行聚类模型在不同数据规模和计算节点数目上具有良好的扩展性.  相似文献   

17.
为提高三维医学数据场的分割效率和准确率,本文利用特征聚类技术,提出了一种新的基于改进K-means聚类的三维医学数据场的体分割算法.根据医学数据的物理意义和医学特征分析,对数据场进行预处理,以加快后继处理速度;分析推导了基于改进K-means聚类的分割算法,并改进了算法采样技术,减少需要计算的像素数目以进一步提高处理速度.实验结果表明本算法不仅能够提高三维医学组织的聚类分割精度至96%,而且能够提高66%的模型处理速度.  相似文献   

18.
目的结合中文信息处理技术,设计一个网络舆情监控系统;针对网络舆情挖掘研究中存在的问题,提出了一种K-means改进算法,实现Web挖掘基础上的文本聚类与主题发现。方法构建一个基于聚类分析的网络舆情监控系统,并详细介绍系统各个模块用到的关键技术;提出了一种K-means改进算法,对K-means算法中的关键环节(聚类初始值的选择和孤立点的剔除)进行了改进。结果设计的系统能通过对网页、论坛、博客、新闻评论等网络资源的精确采集,并结合网页净化、中文分词、向量模型建立、特征选择、降维处理,文本聚类等中文信息处理技术,实现对网络舆情的监测;改进算法的总体思路是要求用户输入簇的初始个数k和最大值kmax,由改进算法在计算过程中自动计算出聚类的结果数k。结论设计了一个基于聚类分析的网络舆情监控系统;提出了一种K-means改进算法。具体算法实施及将这些关键技术整合实现成一套自动化的网络舆情信息采集、分析、监测与预警系统,是网络舆情挖掘研究工作的下一步重点。  相似文献   

19.
K-means 是一种基于划分的聚类算法,由于 K-means 算法在选择初始聚类中心时是随机选取 k 个点,因此一旦 k 个点选取不合理,将会误导聚类过程,得到一个不合理的聚类结果。在分析聚类结果对初值依赖性的基础上,对初值选取方法进行了分析和研究,采取“射靶”的原理进行类中心搜索。从实验结果中可以发现,改进后 K-means 得到的聚类结果更加稳定,对初始聚类中心的依赖性减弱了。  相似文献   

20.
传统K-means 算法对于聚类初始点的选取和距离度量的计算异常敏感,因而很可能导致K-means 算法只能收敛得到局部最优解。为此,提出一种改进的K-means 算法,即K-means 聚类算法最优匹配算法,并进行了相关的算法实验分析。该改进算法首先对传统的K-means 聚类算法进行初始点的选取,并分析聚类结果。然后,分别从初始聚类中心的选择和距离算法的确定进行实验测试,引入轮廓系数评价聚类效果,分析实验结果可知,K-means 聚类算法最优匹配算法具有较好的稳定性和较高的聚类准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号