首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对电信行业客户流失预测问题的复杂性,本文将能够处理大规模数据、容噪性能较好的组合分类器算法——随机森林方法应用于电信行业的客户流失预测中.针对影响组合分类器性能的关键指标——差异度,提出了一种新的基于随机森林相似度矩阵的差异度测度,并在此基础上提出了一种改进的组合剪枝技术,对随机森林的基分类器进行剪枝,得到规模较小但泛化性能更优的基于剪枝随机森林的客户流失预测模型.实验结果表明,与其他方法相比,新的差异度测度方法更好地描述单个分类器之间的差异度,本文提出的基于剪枝随机森林的客户流失预测模型具有更高的预测准确率、更小的组合分类器规模和更好的效率,有望成为该领域一种可行且有效的方案.  相似文献   

2.
针对电信领域客户流失的问题,提出了改进聚类的客户流失预测模型。根据通信行业中实际客户流失数据的正负样本数量不平衡而且数据量特别大的特点,提出带有不同权重参数的改进聚类算法,并将其用于电信行业的客户流失预测模型中。通过实际电信客户数据集测试,与传统的预测算法比较,证明这种算法适合解决大数据集和不平衡数据,具有更高的精确度,能够取得较好的客户流失预测效果。  相似文献   

3.
电信客户信用风险等级评估是对电信客户的信用风险进行等级分类. 针对建立客户信用风险等级分类模型时,大量带有类标注数据难以获得的问题,提出了基于主动学习的分类器建模方法,并对基于QBC(委员会投票选择)的主动学习算法进行改进以提高分类器的预测精度. 通过对实际电信客户数据进行信用风险等级建模实验,结果表明:应用新算法,分类器使用了较少的带类标签样本数据,达到了与被动学习相同的精度,大大降低了信用专家评估数据的工作量.  相似文献   

4.
针对电信行业客户流失问题,使用随机森林方法建立了初步的预测模型,对比电信行业原用的各种预测模型,其准确率有明显改善;针对模型特征维数众多的特点,进一步提出基于随机森林和转导推理的特征提取方法,对数据集进行降维,并引入单类支持向量机(support vector machine,SVM)算法得到最终的预测模型.实验表明,流失预测模型具有更高的预测准确率以及针对预测结果的部分可解释性.  相似文献   

5.
由于在互联网、电信、生物信息、社会网络分析等领域可获得的链接丰富的数据日益增多,链接挖掘已经成为数据挖掘的研究热点。基于链接分类是链接挖掘的一个重要方向。在此以电信领域用户通话特征数据为对象,研究了基于链接分类技术及其在电信客户流失预测的应用方法,在提取并分析大规模客户呼叫图的极大团、结点膨胀率、结点聚集度等与节点稳定性相关的链接属性及其时变特征的基础上,提出了一种适合海量数据的基于链接的电信客户流失预测算法。实验结果表明,此算法较传统分类算法能提高客户流失预测性能,实现了基于链接分类方法的成功应用。  相似文献   

6.
针对电信行业客户流失的问题,设计基于决策树C5.0、BP神经网络及 Logistic 回归算法的组合预测模型,并对某电信企业进行客户流失预测.预测结果表明:与单一客户流失预测模型相比,组合预测模型命中准确率高,预测效果好,更能直观地显示出流失客户的基本特征.  相似文献   

7.
高价值移动通信用户预测是电信客户关系管理中的一项重要内容。针对建立预测模型时遇到的高维、大规模、类不平衡等数据处理问题,提出了一种基于有效特征选择的预测方法。利用欠采样方式从初始不平衡数据集提取多个平衡训练集,使用结合Pearson相关性分析和随机森林特征重要性评估的特征选择策略,在集成学习方法中嵌入加权和投票机制获得最优的特征子集,最后采用随机森林算法建立预测模型。实验结果表明,该预测模型可以有效降低特征集的维度并提升对高价值移动通信用户的预测性能。  相似文献   

8.
针对电信企业客户流失的不规律性,提出以粗糙集(RS)_RBF神经网络作为电信企业客户流失的预测模型.首先利用粗糙集理论对客户属性约简,简化了网络结构.其次提出以约简后的决策表的规则支持度作为径向基函数的响应宽度基准,此种赋值方法相比传统方法更具合理性和科学性.最后利用正交最小二乘法(OLS)求得对网络输出贡献度较大的条件属性集和网络权值.把本模型与其它RBF预测模型应用于电信企业客户流失预测并且进行效果比较,实验结果证明了本模型的有效性和高效性.  相似文献   

9.
对电信客户流失数据分别构建贝叶斯模型和SVM模型,进行电信客户流失的可能性预测.在实验过程中改变数据量和特征字段,借助clementine 12.0的可视化实验平台直观、有效地观察5种模型的预测结果,并对贝叶斯和SVM的5种模型进行比较,得出结论:在属性值较多的情况下,采用贝叶斯Markov-FS模型;在属性值较少且与预测结果高度相关的情况下,SVM中多项式核函数模型预测结果的正确率和稳定性都比较好.  相似文献   

10.
一种新的蛋白质亚细胞定位预测训练集构造方法   总被引:1,自引:0,他引:1  
设计了一种新的蛋白质亚细胞定位预测训练集构造方法.该方法针对传统预测方法缺乏足够的实验标记数据的问题,基于主动学习策略从非实验标记蛋白质数据中主动选择有效数据,并与原有的实验标记数据共同训练预测模型,以提高基准分类器的预测精度.结合支持向量机分类器,该方法在病毒蛋白质独立测试集上进行了预测实验,测试结果表明,该方法能够有效地提高基准分类器的预测能力,性能优于现有的病毒蛋白质预测系统.  相似文献   

11.
随着电信市场竞争越来越激烈,电信行业面临的一个严重的问题就是客户频繁流失.而数据挖掘技术是提取海量数据和分析数据的重要工具.以“陕西联通公司铜川分公司”作为研究对象,利用数据挖掘的技术,建立模型,分析流失客户的数据,制定相应的决策避免客户流失.  相似文献   

12.
针对现有客户流失预测模型预测准确率低下的问题,本文结合基于统计学习的客户聚类分析和分类预测技术来构建客户流失预测模型。根据模型计算结果,可以辨别出客户类别及流失倾向,并在此基础上提出了预防客户流失的保持措施,从而为电信企业运营商的客户关系管理提供决策依据。  相似文献   

13.
随着电信市场竞争加剧,客户流失现象成为电信运营商关注的问题。文中基于数据挖掘手段,采用贝叶斯网络分类器,进行电信客户流失分析。在贝叶斯网络构造过程中,结合采用K2和MC-MC算法构建网络。根据贝叶斯网络的拓扑结构,筛选出客户流失相关的显著指标;由条件概率表确定客户的流失规则,进而确定高流失的客户群。考虑分类的误判损失函数,给出不同分类临界值下,贝叶斯网络模型的分类效果。与其它分类算法相比,比如决策树和人工神经网络,在客户流失率很低的情况下,该算法不需要进行“过量抽样”。  相似文献   

14.
生存分析在电信增值服务行业客户流失分析中的应用   总被引:2,自引:0,他引:2  
利用生存分析对一家电信增值业务提供商的客户流失数据进行了实证研究,提出了一个预测客户流失概率的模型.利用该模型能及时准确地掌握客户流失情况,以此可以提高企业决策的针对性,降低客户流失率.  相似文献   

15.
基于MBBC算法的电信客户信用度评分模型   总被引:1,自引:0,他引:1  
客户信用度是评价客户欠费风险的指标.目前国内对电信客户信用度评估采用线性公式,其对相关客户属性的权值进行简单的相加,但是实际客户信用度与各相关属性之间并不是简单的线性关系,而是非线性关系.因此,针对电信客户信用度评分问题,提出了一种应用马尔科夫毯贝叶斯网络分类器建立模型的方法.实验结果显示,该算法建立的客户信用度评分模型简洁、易懂和准确率高.  相似文献   

16.
针对样本和高维数据,研究基于支持向量机的特征选择算法及其在高校就业预测中的应用.利用采集的就业数据,使用SVM方法对数据集进行特征选择,再利用SVM分类器对数据进行已就业和未就业学生的分类,得到了较好的预测结果,为高校就业指导提供了一定的依据.  相似文献   

17.
基于SVM预测的金融主题爬虫   总被引:2,自引:2,他引:0  
随着Internet上信息的爆炸,利用通用搜索引擎检索用户相关的信息变得越来越困难,而主题爬虫成为WEB上检索主题相关信息的重要工具.目前大部分基于分类器预测的主题爬虫的训练数据是不同类别网页的内容,但是在实际预测过程只能根据父网页中的一些链接信息进行预测,所以造成主题爬虫的预测的准确率较低.本文使用SVM分类器对标注了类别的URL以及上下文和锚文本进行训练,并分别使用了DF和信息增益两种不同的特征选择方法进行特征筛选,对影响分类器的各种因素进行了实验对比,并对分类器进行了在线的实验.实验证明这种方法在实际预测过程中效率很高.  相似文献   

18.
一种基于特征选择的入侵检测方法   总被引:1,自引:0,他引:1  
针对入侵检测中网络数据高维度、 大规模所带来的问题, 基于特征选择方法Fisher在网络安全数据集中的应用, 提出一种基于特征选择的通用入侵检测框架. 该方法通过提取关键特征, 降低安全数据的维度; 采用K近邻方法作为分类器, 验证特征选择后的检测效果. 实验结果表明, 该方法能在较少特征的情况下达到较高的检测率, 具有较好的可行性.  相似文献   

19.
非契约情景下的客户流失问题越来越引起各方重视.作为此情景下的典型--电子商务网站而言,因其特殊性使得网站客户流失问题更难判断.Pareto/NBD模型是描述非契约客户关系情景下首个考虑到客户流失现象的客户重复购买预测模型,它通过预测客户的活跃程度P(active),较好的解决了客户流失预测问题.以Pareto/NBD模型为基础模型对某电子商务网站进行实证研究以此来验证模型解决非契约情景下流失预测问题的有效性.  相似文献   

20.
结合K-means的分类方法在电信客户流失中的应用   总被引:1,自引:0,他引:1  
通过对电信业客户流失预测的国内外研究成果的分析,我们发现造成电信业客户流失原因种类比较多、难以用一种通用的划分标准对流失客户的流失特征进行刻画,因此本文提出了将K-means算法与传统的分类算法相结合的方法进行客户流失分析,并进行了应用实验.该实验以中国联通湖南某地区X分公司的客户数据为基础,利用数据挖掘软件Clementine8.1建立了客户流失分类预测模型,模型的应用结果表明:新方法对客户流失预测的命中率高于传统的分类预测算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号