首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
【目的】研究评价问题中评价对象因个体差异性的聚类问题。【方法】首先引入夹角余弦刻画评价对象个体间倾向性上的差异大小,其次利用余弦相似度与欧式距离刻画评价对象的总体相似度,对Tzortzis和Likas提出的min-max K-means聚类算法进行改进。【结果】利用某高校参与评价教师的指标数据集进行初步的数值实验,证明了改进K-means算法的有效性。【结论】余弦相似度刻画考核对象的偏向性差异,很好的克服了欧式距离只考虑数值绝对值上的差异,具有重要的现实意义。  相似文献   

2.
K-means算法需要人工设定聚类个数且易受孤立点影响,根据这个缺陷提出了一种新的改进算法。改进算法通过设定初始值及初始值的最大值,在聚类过程中自动获取聚类数k。实验结果表明,该算法在一定程度上缓解了K-means算法对初始值敏感及受孤立点影响的问题,能产生高质量的聚类结果。  相似文献   

3.
结合K-means的分类方法在电信客户流失中的应用   总被引:1,自引:0,他引:1  
通过对电信业客户流失预测的国内外研究成果的分析,我们发现造成电信业客户流失原因种类比较多、难以用一种通用的划分标准对流失客户的流失特征进行刻画,因此本文提出了将K-means算法与传统的分类算法相结合的方法进行客户流失分析,并进行了应用实验.该实验以中国联通湖南某地区X分公司的客户数据为基础,利用数据挖掘软件Clementine8.1建立了客户流失分类预测模型,模型的应用结果表明:新方法对客户流失预测的命中率高于传统的分类预测算法.  相似文献   

4.
面对日益激烈的竞争环境,不管是金融行业,还是电信行业,企业运营营销方式从大众化营销转为根据不同的用户群体需求提供的差异化营销,而差异化营销的关键因素就是用户有效细分。本文根据通信用户通话数据作为分析对象,通过采集相关特点人群呼入呼出次数、通话持续时长等数据比较筛选后得到相关特征,对用户通话数据进行聚类,以此获取具有良好电信特征的群体。然后在以上筛选基础上,结合用户数据,采用K-means算法挖掘出用户数据与相关工作业务之间存在的相关关联性结果。企业可以此类用户细分为指导,为用户提供更好的优质服务。  相似文献   

5.
文章将Cox模型运用于客户流失预测研究中,通过对中国移动通信某分公司提供的历史数据的研究,计算出每个客户的生存概率,并按照生存概率从小到大排序,等分为10组,实际流失的客户基本上都落在第1组中,覆盖率达到89%以上,运营商只对原来客户的10%进行维护与挽留,大大减少了工作量和挽留成本。该方法用于移动通信行业的客户流失预测中有很好的效果。  相似文献   

6.
针对电信领域客户流失的问题,提出了改进聚类的客户流失预测模型。根据通信行业中实际客户流失数据的正负样本数量不平衡而且数据量特别大的特点,提出带有不同权重参数的改进聚类算法,并将其用于电信行业的客户流失预测模型中。通过实际电信客户数据集测试,与传统的预测算法比较,证明这种算法适合解决大数据集和不平衡数据,具有更高的精确度,能够取得较好的客户流失预测效果。  相似文献   

7.
K—means聚类算法在客户细分中的应用   总被引:2,自引:0,他引:2  
以某超市会员为研究对象,以其会员卡的消费记录为数据源,运用K-means聚类算法对该超市VIP客户进行细分,得到一个细分模型,该模型对企业营销策略的制定具有一定的辅助作用.  相似文献   

8.
K-means算法是一种基于距离的典型的聚类算法,采用以距离作为相似性的评价指标,认为两个对象的距离越近,其相似度就越大。通过K-means算法实验项目comb叙述Kmeans算法的实现,并进行了结果分析。  相似文献   

9.
针对原始K-means算法的一系列问题,提出一种基于半监督的K-means聚类改进算法,能够自动进行聚类,找出最优K值,并且最大限度地找出孤立点.首先根据样本集自身的特点,按照"类内尽可能相似"原则一步一步形成数据集,然后对数据集进行"去噪"与合并相似簇,最后,利用少量的标记信息指导和修正聚类结果.在UCI的多个数据集...  相似文献   

10.
针对电信企业客户流失的不规律性,提出以粗糙集(RS)_RBF神经网络作为电信企业客户流失的预测模型.首先利用粗糙集理论对客户属性约简,简化了网络结构.其次提出以约简后的决策表的规则支持度作为径向基函数的响应宽度基准,此种赋值方法相比传统方法更具合理性和科学性.最后利用正交最小二乘法(OLS)求得对网络输出贡献度较大的条件属性集和网络权值.把本模型与其它RBF预测模型应用于电信企业客户流失预测并且进行效果比较,实验结果证明了本模型的有效性和高效性.  相似文献   

11.
工件表面缺陷的存在影响工件产品的质量以及工件的安全使用,传统的工件表面缺陷检测由人工完成,工作量大且易受到检测人员主观因素的影响,很难保证检测的效率与精度.本文提出了一种基于改进的K-means算法的工件表面缺陷分割算法,将自适应人类学习优化算法应用到K-means聚类算法中,使自适应人类学习优化算法初始化K-mean...  相似文献   

12.
随着电信市场竞争加剧,客户流失现象成为电信运营商关注的问题。文中基于数据挖掘手段,采用贝叶斯网络分类器,进行电信客户流失分析。在贝叶斯网络构造过程中,结合采用K2和MC-MC算法构建网络。根据贝叶斯网络的拓扑结构,筛选出客户流失相关的显著指标;由条件概率表确定客户的流失规则,进而确定高流失的客户群。考虑分类的误判损失函数,给出不同分类临界值下,贝叶斯网络模型的分类效果。与其它分类算法相比,比如决策树和人工神经网络,在客户流失率很低的情况下,该算法不需要进行“过量抽样”。  相似文献   

13.
非契约情景下的客户流失问题越来越引起各方重视.作为此情景下的典型--电子商务网站而言,因其特殊性使得网站客户流失问题更难判断.Pareto/NBD模型是描述非契约客户关系情景下首个考虑到客户流失现象的客户重复购买预测模型,它通过预测客户的活跃程度P(active),较好的解决了客户流失预测问题.以Pareto/NBD模型为基础模型对某电子商务网站进行实证研究以此来验证模型解决非契约情景下流失预测问题的有效性.  相似文献   

14.
一种改进的基于密度和样本数量的K-means算法   总被引:1,自引:0,他引:1  
对原始K-means算法进行了研究,通过改进,算法能够自动找出合适的k值,并且最大限度的找出孤立点。首先,寻找样本容量的最大可能初始聚类数n。然后做样本圆,将样本圆等分为n份,依据样本点的位置将样本归属到相应的份里,对初始的n个类进行聚类。最后通过应用DBSCAN算法的小类合并策略将需要合并的小类进行了合并。为了测试改进算法的聚类性能,将改进后的算法源码放在新西兰怀卡托大学所开发的开源平台"weka"上,在多个数据集上与原始K-means算法进行了对比实验,验证了改进算法在聚类质量和聚类稳定性上都远优于原始K-means算法。  相似文献   

15.
基于信息熵改进的 K-means 动态聚类算法   总被引:1,自引:2,他引:1  
初始聚类中心及聚类过程产生的冗余信息是影响K-means算法聚类性能的主要因素,也是阻碍该算法性能提升的主要问题.因此,提出一个改进的K-means算法.改进算法通过采用信息熵对聚类对象进行赋权来修正聚类对象间的距离函数,并利用初始聚类的赋权函数选出质量较高的初始聚类中心点;然后,为算法的终止条件设定标准阈值来减少算法迭代次数,从而减少学习时间;最后,通过删除由信息动态变化而产生的冗余信息来减少动态聚类过程中的干扰,以使算法达到更准确更高效的聚类效果.实验结果表明,当数据样本数量较多时,相比于传统的K-means算法和其他改进的K-means算法,提出的算法在准确率和执行效率上都有较大提升.  相似文献   

16.
聚类分析是一种重要的数据挖掘方法,K-means算法是其中最常用的基于划分的方法。本文提出了一种基于初始均值点离散化的改进K-means算法。改进的算法在选取初始均值点时,尽量使初始均值点的分布离散化,解决了传统算法中随机选取初始均值点所造成的一些问题。同时,为了得到更高质量的聚类结果,本文进行了数据集中的离群点检测和自动确定参数k的最佳取值两方面的前期处理工作。实验证明,改进后的算法明显优于传统算法。  相似文献   

17.
本文针对如何在不同的数据挖掘工具之间交换数据挖掘结果,以使挖掘结果独立于不同的挖掘工具的问题,采用了数据挖掘语言来描述所建立的客户流失预测模型。  相似文献   

18.
一种改进的K-means聚类算法   总被引:1,自引:0,他引:1  
传统的K-means聚类算法对初始聚类中心的依赖程度很大,聚类结果会随聚类中心的选择不同波动很大,为了消除这种中心选择不确定性,提出一种改进的K-means聚类算法,从而有效地改善初始聚类中心点选择的随机性,提高聚类结果的稳定性.仿真实验结果表明,改进后的K-means聚类算法优于传统的算法.  相似文献   

19.
基于2d-距离改进的K-means聚类算法研究   总被引:1,自引:0,他引:1  
为了解决原始K-means算法随机选取聚类中心对聚类结果产生较大影响的不足和孤立点的存在对聚类精度的破坏,以及两者之间的相互牵制性,采用基于2d-距离的DKC值来对原始样本数据集进行预处理以分辨孤立点,同时确定初始的聚类中心,达到消除两者相互影响的效果,使得聚类中心相对稳定,改进后的算法较原始的算法在准确度上得到了改进。  相似文献   

20.
随着经济的发展,通讯行业的竞争也日益激烈,客户流失已经成为造成企业经济损失的重要原因。为了给企业决策者提供较为准确的客户流失预测分析,提出了基于集成多分类模型的预测方法。基础模型的构造上选择基于显露模式的算法,在训练样本上建立N个并列的基础模型,按投票的方式集成N个模型的决策能力,最终对客户流失进行准确的预测,为电信公司的决策层提供可靠的分析结果。实验数据表明,相对于单一模型,集成分类算法不仅有显著的分类准确率,还有较强的泛化能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号