首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 945 毫秒
1.
针对电信行业客户流失的问题,设计基于决策树C5.0、BP神经网络及 Logistic 回归算法的组合预测模型,并对某电信企业进行客户流失预测.预测结果表明:与单一客户流失预测模型相比,组合预测模型命中准确率高,预测效果好,更能直观地显示出流失客户的基本特征.  相似文献   

2.
针对电信行业客户流失问题,使用随机森林方法建立了初步的预测模型,对比电信行业原用的各种预测模型,其准确率有明显改善;针对模型特征维数众多的特点,进一步提出基于随机森林和转导推理的特征提取方法,对数据集进行降维,并引入单类支持向量机(support vector machine,SVM)算法得到最终的预测模型.实验表明,流失预测模型具有更高的预测准确率以及针对预测结果的部分可解释性.  相似文献   

3.
电信客户流失预测是电信运营商客户关系管理系统的一个重要问题,其目的是预测具有较高流失风险的客户.电信客户流失预测模型的构建过程包括数据预处理、不均衡处理、特征选择和分类器的训练与评估.针对电信数据集中存在的特征维度过高问题,结合过滤式特征选择和嵌入式特征选择方法的优点,提出了一种基于Fisher比率和预测风险准则的分步特征提取方法.结合真实数据集的实验结果表明,该方法能够减少特征维度,提高分类器的预测效果.  相似文献   

4.
针对电信领域客户流失的问题,提出了改进聚类的客户流失预测模型。根据通信行业中实际客户流失数据的正负样本数量不平衡而且数据量特别大的特点,提出带有不同权重参数的改进聚类算法,并将其用于电信行业的客户流失预测模型中。通过实际电信客户数据集测试,与传统的预测算法比较,证明这种算法适合解决大数据集和不平衡数据,具有更高的精确度,能够取得较好的客户流失预测效果。  相似文献   

5.
针对现有客户流失预测模型预测准确率低下的问题,本文结合基于统计学习的客户聚类分析和分类预测技术来构建客户流失预测模型。根据模型计算结果,可以辨别出客户类别及流失倾向,并在此基础上提出了预防客户流失的保持措施,从而为电信企业运营商的客户关系管理提供决策依据。  相似文献   

6.
由于在互联网、电信、生物信息、社会网络分析等领域可获得的链接丰富的数据日益增多,链接挖掘已经成为数据挖掘的研究热点。基于链接分类是链接挖掘的一个重要方向。在此以电信领域用户通话特征数据为对象,研究了基于链接分类技术及其在电信客户流失预测的应用方法,在提取并分析大规模客户呼叫图的极大团、结点膨胀率、结点聚集度等与节点稳定性相关的链接属性及其时变特征的基础上,提出了一种适合海量数据的基于链接的电信客户流失预测算法。实验结果表明,此算法较传统分类算法能提高客户流失预测性能,实现了基于链接分类方法的成功应用。  相似文献   

7.
在研究数据挖掘实现技术的基础上,将此技术运用到防止电信行业的客户流失中.以无线市话(PHS)的历史数据为对象,建立客户流失预测模型.通过对预测模型的评估,得到了预测效果较好的模型.  相似文献   

8.
针对电信企业客户流失的不规律性,提出以粗糙集(RS)_RBF神经网络作为电信企业客户流失的预测模型.首先利用粗糙集理论对客户属性约简,简化了网络结构.其次提出以约简后的决策表的规则支持度作为径向基函数的响应宽度基准,此种赋值方法相比传统方法更具合理性和科学性.最后利用正交最小二乘法(OLS)求得对网络输出贡献度较大的条件属性集和网络权值.把本模型与其它RBF预测模型应用于电信企业客户流失预测并且进行效果比较,实验结果证明了本模型的有效性和高效性.  相似文献   

9.
研究表明,具有较大边际分别的组合分类器泛化性能更高.根据该结论,论文构造了一个新的基于边际的度量指标(MM)以充分考虑基分类器和组合分类器的分类能力,进而提出了一种新的组合分类器选择方法.该方法初始化组合分类器为空(或满),迭代的加入(或移除)具有最大(或最小)MM值的分类器,以降低组合分类器规模并提高它的分类准确率.在随机选择的24个UCI数据集上的实验表明,与其他一些高级的贪心组合选择算法相比,该方法具有更好的泛化能力.  相似文献   

10.
为了能够精准可靠地估计太阳能辐照度,本文提出一种基于贝叶斯模型组合的随机森林算法用于太阳能辐照度预测.首先,引入K-means聚类和K折交叉验证将气象数据训练集生成多个训练子集,以增加训练子集的多样性并保证均匀采样.其次,将随机森林作为基学习器建立集成学习预测模型,导入训练子集并训练各个随机森林.之后,依据各个随机森林在验证集上的预测性能,采用贝叶斯模型组合算法制定组合策略.个体随机森林在测试集上的预测值经过模型组合策略得到最终输出.最后,基于气象实测数据建立仿真实验,并引入其他四种预测方法进行对比仿真研究,通过实验结果验证了文中所提出预测方法在太阳能辐照度预测问题中的准确性和可靠性.  相似文献   

11.
区间型组合预测模型的研究核心是确定各单项预测方法的权重。鉴于向量投影是一个综合性测度,既能反映两个向量指标对象之间距离,又能反映他们之间的夹角,本研究提出了一种新的向量标准化投影测度公式。在向量标准化投影测公式的基础上,定义了区间数向量标准化投影测度的概念,用以描述两个区间数向量的接近程度,以组合预测区间数序列和实际区间数序列的标准化投影测度为最优化准则,构建了两个基于投影测度的全新区间型组合预测模型。并通过两个实例进行了分析:(1)与已有文献的组合预测方法的结果作对比研究,验证了本法所构建的组合预测模型的有效性;(2)对我国2010-2022风力发电量序列进行拟合和预测建模,结果表明本法构建的组合预测模型有更好的拟合和预测效果,具有一定的可行性和实用性。  相似文献   

12.
针对客户信用数据款项维度多、数量大、复杂性等问题,提出了一种基于相似性度量的多视角决策融合个人信用评估方法。该方法创新点在于能够细致地考虑不同信用数据的几何形状,多角度划分数据,并进行相似性匹配,此外充分运用随机森林能够进行特征提取的自洽性使得模型的准确性与稳健性同步得到了提高。在UCI数据集上的实验结果表明: 3种距离测度在进行特征提取与异常值去除后,性能均得到了大幅提升,且识别率的波动区间相对于数据预处理前显著缩小,展现了优化后的模型具有更强的稳健性;融合3种测度的决策可以多角度地综合信用信息,使得识别性能较单一测度显著优化,且与其他经典组合方法 比较性能更佳;将随机森林与距离测度相组合应用于个人信用评估领域为个人信用评估方法的多样性增添了新的经验。  相似文献   

13.
为了把握客户流失量的变化趋势,提高客户流失量的预测精度,提出一种基于组合优化理论的客户流失量预测模型.分别采用灰色模型和神经网络对客户流失量进行建模与预测,并对客户流失量线性和非线性变化趋势进行刻画,然后采用支持向量机对灰色模型和神经网络的预测结果进行加权,得到客户流失量的最终预测结果.用仿真实验对模型的性能进行测试,结果表明,相对于单一客户流失量预测模型,基于组合优化理论的客户流失量预测模型可以从多个方面对客户流失量的变化特点进行描述,提高了客户流失量的预测精度.  相似文献   

14.
高价值移动通信用户预测是电信客户关系管理中的一项重要内容。针对建立预测模型时遇到的高维、大规模、类不平衡等数据处理问题,提出了一种基于有效特征选择的预测方法。利用欠采样方式从初始不平衡数据集提取多个平衡训练集,使用结合Pearson相关性分析和随机森林特征重要性评估的特征选择策略,在集成学习方法中嵌入加权和投票机制获得最优的特征子集,最后采用随机森林算法建立预测模型。实验结果表明,该预测模型可以有效降低特征集的维度并提升对高价值移动通信用户的预测性能。  相似文献   

15.
针对基于降维的神经网络分类器预测模型在分析过程中存在特征丢失, 并导致精度下降的问题, 提出一种基于随机森林算法优化的多层感知器(MLP)回归预测模型. 该优化模型通过在MLP回归模型网络的全连接层和逻辑回归层之间增加一个优化机制, 利用随机森林算法对隐藏层状态的优化实现改进, 从而解决了降维过程中神经网络丢失数据特征的问题. 在借贷客户信息数据集上的实验结果表明, 该模型在保证主要特征的同时大幅度提升了预测准确率, 证实该模型在特征工程中具有较高的实用性.  相似文献   

16.
针对传统随机向量函数链接网络集成模型时多样性不足和泛化性能差的问题,提出一种改进的随机向量函数链接集成模型.首先,通过6种简单回归模型替代传统随机向量函数链接网络中的直接链接;其次,采用高斯过程回归(Gaussian process regression, GPR)方法初始化隐含层参数,增强各基分类器的多样性;最后,使用不同的结合策略,集成具有差异性的基分类器得到预测模型.结果表明,改进的随机向量函数链接集成模型的预测精度明显高于其他传统集成模型,较传统随机向量函数链接网络具有更好的泛化性能.  相似文献   

17.
针对寿险行业的客户流失问题,构建基于外在、内在、行为(EIB)属性的寿险客户指标体系。提出改进的K-means算法,使用改进的轮廓系数公式判断初始聚类数目,并利用欧式距离相似度与余弦相似度的测度优势提出欧式类簇空间的局部、全局离群点过滤规则。运用传统的K-means算法、不同离群点监测阈值下的改进Kmeans算法进行客户细分及其可视化展示,并采用BP-Adaboost算法对细分后的客户进行流失预测。实证表明:改进的K-means算法可视化噪声降低、簇内误方差减小,可在后续的预测器中实现更高预测精度,为保险公司挖掘更精准的客户分类信息、挽留客户提供决策依据。  相似文献   

18.
为了快速精确地利用基本物性指标预测湿陷性黄土的湿陷性系数,基于多种数据挖掘方法提出了离散型二项式系数组合预测模型。首先,采用相关系数法和随机森林重要性指数法综合选取模型基本物性指标为饱和度、干密度、液性指数和天然含水量;然后,分别利用多元线性回归、BP神经网络、支持向量机回归(SVR)和随机森林(RF)回归对黄土湿陷性系数进行预测,并将预测结果进行组合,得到4种单一模型、2种传统组合模型和离散型二项式系数组合模型预测结果;最后,利用6种不同精度指标对上述7种预测模型展开精度分析。结果表明:组合预测模型精度整体高于单一预测模型,且提出的离散型二项式系数组合模型各精度指标均为最优,平均相对误差为3.43%。可见提出的离散型二项式系数组合模型可为湿陷性黄土地区的工程设计提供参考。  相似文献   

19.
电信客户信用风险等级评估是对电信客户的信用风险进行等级分类. 针对建立客户信用风险等级分类模型时,大量带有类标注数据难以获得的问题,提出了基于主动学习的分类器建模方法,并对基于QBC(委员会投票选择)的主动学习算法进行改进以提高分类器的预测精度. 通过对实际电信客户数据进行信用风险等级建模实验,结果表明:应用新算法,分类器使用了较少的带类标签样本数据,达到了与被动学习相同的精度,大大降低了信用专家评估数据的工作量.  相似文献   

20.
针对单一的分类器用于旋转机械故障诊断时存在准确率不高的问题,提出一种基于随机森林算法的旋转机械齿轮组故障诊断方法。该方法利用随机森林多分类器组合决策树的思想,通过多分类器的组合学习提高故障诊断的准确率,并在风力涡轮动力传动系统故障诊断模拟器系统上进行了多工况多故障的实验验证。首先,收集多工况、多故障的齿轮传感器信号,提取传感器信号的时域特征作为随机森林的输入特征量。然后,利用构建好的随机森林模型进行齿轮组的故障诊断,并将随机森林算法的分类结果与支持向量机方法的分类结果进行对比。通过对故障诊断结果的分析,随机森林算法避免了复杂的寻参过程和传统分类器的过拟合现象,能够处理大规模数据集,通过分类器的组合,提高了故障诊断准确率,并缩短了分类模型的预测时间,具有较好的应用前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号