首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
遗传算法选择性集成多分类器的企业财务困境预测   总被引:2,自引:0,他引:2  
为了更加有效地进行企业财务困境预测,本文提出了基于遗传算法选择性集成的多分类器系统。与事先静态给定系统内部基本分类器组成不同,该方法以组合系统预测准确率为优化目标,无需度量各基本分类器之间的差异性,可以动态挖掘最优组合系统。实证研究中以中国上市公司为研究对象,以10折交叉验证准确率作为评价标准,结果表明该方法显著优于全集成以及单分类器最优模型。  相似文献   

2.
集成学习的多分类器动态融合方法研究   总被引:5,自引:0,他引:5  
AdaBoost集成学习方法中,分类器一经学习成功,其投票权值就已确定,同一分类器对所有待测样本均有相同的投票权值。对于难于分类样本,具有良好分类性能的少数分类器权值却较低。提出适用于集成学习方法的权重自适应调整多分类器集成算法。根据多分类器行为信息,产生待测样本局部分类精度的有效判定区域,基于有效判定区域选择不同的分类器组合,并调整其相应权重,利用样本集上的统计信息来动态指导分类集成判决。实验结果表明,该算法提高了集成分类性能。  相似文献   

3.
在客户流失预测问题中, 客户数据的特征往往会影响模型的预测效果.分析了常用的“两步式”客户流失 预测方法的不足,提出了基于数据分组处理(GMDH)技术的“一步式”客户流失预测集成研究框架.该框架一方面 将数据预处理和客户流失预测建模过程进行集成,另一方面用多分类器集成策略进行客户流失预测建模.以客户数据类别分布不平衡的客户流失预测问题为例,构建了与数据特征相适应的“一步式”集成模型. 实证结果表明,该方法能够更有效地进行客户流失预测.  相似文献   

4.
基于多特征子集组合分类器的企业财务困境预测   总被引:3,自引:0,他引:3  
为了更加有效地进行企业财务困境预测,利用t检验、单因素方差分析、逐步判别分析、逐步逻辑回归和邻域粗糙集5种特征提取方法,结合支持向量机、多元判别分析、Logistic回归、分类和回归树等多种分类学习算法构造备选基本分类器。在此基础上,提出了基于精度前向搜索和后剪枝的多特征子集组合分类器财务困境预测方法。该方法无需计算单分类器之间的差异性,首先以系统预测精度最大化为原则进行前向搜索,然后通过后剪枝策略选择精度最高或满意的系统作为最终结果。实证研究中以中国上市公司为研究对象,以十折交叉验证精度为评价标准,结果表明,该方法构建的组合系统的分类预测精度明显高于个体最优模型,最优组合系统和最简洁组合系统为财务困境预测提供了更多的灵活性。  相似文献   

5.
分类器集成差异性研究   总被引:3,自引:0,他引:3  
差异性是集成学习中的重要概念,对差异性的研究在集成学习领域中占有基础性地位。从差异度量方法、差异度与分类器集成性能的关系以及差异度在集成优化中的应用三个方面对当前研究进展进行分析。深入分析了现有工作,对存在的问题给出一些解决思路,建议不能为了差异性以较大的基分类器精度损失为代价;不能为了引入差异性而偏离原来的分类问题。  相似文献   

6.
客户流失预测是企业客户关系管理的重要内容.在现实的很多客户流失预测建模过程中,由于数据类别的高度不平衡现象的存在,使得模型的分类性能低下,不能很好地进行分类预测.同时由于现实情况中只有少量有类别标签的样本,更多的是无类别标签数据的存在,造成了大量有用信息的浪费.为了解决以上两个问题,本研究将元代价敏感学习,半监督学习和Bagging集成等技术结合,提出了代价敏感的客户流失预测半监督集成模型(semi-supervised ensemble based on metacost,SSEM).该模型主要包括三个阶段:1)用Metacost方法修改初始有标签训练集L的类别标签,得到新的训练集Lm,并将其随机的分为模型训练集Ltr和模型验证集Va;2)使用Va挑选分类精度最高的三个基分类器,并用其选择性标记无类别标签U中的样本,并将它们添加到Ltr中;3)用新的模型训练集Ltr训练N个基本分类模型,并对测试集样本进行分类,进一步将分类结果进行集成.在两个客户流失预测数据集上进行实证分析,将SSEM模型与常用的监督式集成模型以及半监督式集成模型相比,结果表明,SSEM具有更好的客户流失预测性能.  相似文献   

7.
针对不平衡数据集的客户流失预测算法   总被引:3,自引:0,他引:3  
针对客户关系管理中的客户流失预测问题进行探讨,通过对客户流失数据特点的分析,以及现有预测算法的比较,将数据挖掘方法中的随机森林算法引入客户流失预测,建立预测模型,并在实际的银行业贷款客户数据集上进行实验,得到了较好的效果.  相似文献   

8.
企业财务困境的多分类器混合组合预测   总被引:2,自引:0,他引:2  
为了降低单分类器财务困境预测的不确定性和不稳定性,本文通过多分类器组合来提高预测效果,提出了企业财务困境预测的多分类器混合组合模型,实现了并联组合和串联组合的优势互补作用.采用差异性原则和个体优化原则作为选择基本分类器的标准,在定义单类择优算子的基础上,设计了构建混合组合基本模块的流程算法以及混合组合模型内部并联结构的动态赋权机制和加权多数投票机制.以中国上市公司为对象的实证研究证实了该模型在提高平均预测准确率的同时大大降低了离散程度,统计分析表明:该模型显著优于现有的单分类器财务困境预测模型.  相似文献   

9.
SVM方法及其在客户流失预测中的应用研究   总被引:8,自引:1,他引:8  
客户流失分析与预测是客户关系管理的重要内容.针对客户流失问题,建立了支持向量机预测模型.针对实际客户流失数据中正负样本数量不平衡而且数据量大的特点,提出带有不同类权重参数的支持向量机算法CW-SVM,通过调整类权重参数改变分类面位置,提高算法分类准确性;将标准支持向量机训练问题转化为运算效率更高的核向量机问题,提出处理不平衡海量数据集的CWC-SVM算法.通过实际银行信贷客户数据集测试,该算法与传统预测算法比较,更适合解决大数据集和不平衡数据,取得较好的客户流失预测效果.  相似文献   

10.
基于支持向量机的客户流失预测模型   总被引:5,自引:1,他引:5  
应用基于结构风险最小化准则的支持向量机(SVM)进行客户流失预测,以提高机器学习方法的预测能力,并以国内、国外电信公司客户流失预测为实例,与人工神经网络、决策树、贝叶斯分类器等方法进行了对比,发现该方法能获得最好的正确率、命中率、覆盖率和提升系数,是研究客户流失预测问题的有效方法.  相似文献   

11.
基于SMC-RS-LSSVM的电子商务客户流失预测模型   总被引:1,自引:3,他引:1  
为提高个体层次上客户流失预测的精度,建立了基于SMC-粗糙集-最小二乘支持向量机的电子商务客户流失预测模型.该模型首先利用SMC模型计算出客户活跃度,以0.5为阈值判断出客户流失状态,识别出正判客户和错判客户;其次应用粗糙集理论约简出重要的客户流失预测指标体系,然后将训练样本送入最小二乘支持向量机进行学习和训练,进而对测试样本的客户流失状态进行判别.利用某网上商场的2525名客户样本进行电子商务客户流失预测实证研究,结果表明:与SMC模型、BP神经网络模型、最小二乘支持向量机模型相比,该模型对测试样本预测精度更高,是一种更为有效和实用的客户流失预测方法.  相似文献   

12.
为提高个体层次上客户流失预测的精确度, 建立了融入个体活跃度的电子商务客户流失预测模型H-ULSSVM. 该模型首先利用融入地域因素的启发式算法计算出最优阈值, 并求出个体的活跃度, 识别出正判客户和错判客户; 在此基础上, 考虑电子商务客户流失预测影响因素众多, 提出了一种粗糙等价类属性约简方法提取出重要的客户流失预测指标, 然后将降维后的正判客户样本送到非平衡最小二乘支持向量机进行学习和训练, 进而利用得到的分类器对错判客户样本的客户流失状态进行判别. 在某B2C电子商务平台客户样本的实证研究表明, 该模型与其他方法相比, 具有更好的效率和精确度.  相似文献   

13.
从多阶段、延迟回报的角度提出基于部分可观察马尔可夫决策过程(POMDP)对客户关系的动态发展与管理进行建模的方法.模型以客户关系作为隐状态,以客户购买水平作为隐状态的观察值,以客户管理行动为决策变量.通过模型,可以动态估计客户的关系状态,可以估计各行动对客户关系动态演化的影响,并以客户终生价值为目标优化管理行动.以客户保持-流失两状态客户关系模型为例,说明了模型的具体应用.  相似文献   

14.
近年来,突发事件发生后,事件演进受网络舆情的影响越来越大,分析突发事件发生后网民情绪并进行预测,可为政府部门的应急管理和策略设计提供有效支撑,赢得宝贵的时间.本文提出了一个基于模型集成的微博情感分析与预测模型,对突发事件微博舆情进行情感分类与趋势预测.为了更准确地分析微博情感与未来走势,首先,利用多模型集成策略对突发事件相关的单条微博进行情感分析;接着,将单条微博情感进行集成,形成微博情感时间序列;再次,利用多模型集成思路对微博情感的未来走势进行预测;最后,通过实例验证提出方法的有效性.实证结果表明,集成模型较传统分类在微博情感分析上具有优势,集成模型较传统回归模型在微博情感走势预测同样具有明显优势,可以取得较高的预测精度.  相似文献   

15.
基于粗糙集与遗传算法集成的企业短期贷款违约判别   总被引:3,自引:0,他引:3  
建立了粗糙集和遗传算法集成的企业贷款违约判别模型.该模型首先利用FUSINTER方法离散化财务数据,并应用遗传算法约简评价指标,进而基于最小约简指标提取违约判别规则,最后对企业短期贷款检验样本进行违约判别.利用贷款企业数据库558家样本企业进行交叉验证技术的实证研究,结果表明,与多元判别分析、logistic、BP神经网络等违约判别模型相比,粗糙集和遗传算法集成的违约判别模型是一种更为有效和实用的信用风险评估工具.  相似文献   

16.
提出并计算了基于单个客户的广义客户终身价值和挽救费用上限.在此基础上,提出了有挽救总经费约束条件下、为实现全体流失客户终身价值最大化的挽救模型,包括流失客户是否挽救的依据,如何确定各类客户的挽救比例、挽救费用、挽救次序等.最后给出一个算例.  相似文献   

17.
Ensemble of multiple kNN classifiers for societal risk classification   总被引:1,自引:1,他引:0  
Societal risk classification is a fundamental and complex issue for societal risk perception. To conduct societal risk classification, Tianya Forum posts are selected as the data source, and four kinds of representations: string representation, term-frequency representation, TF-IDF representation and the distributed representation of BBS posts are applied. Using edit distance or cosine similarity as distance metric, four k-Nearest Neighbor (kNN) classifiers based on different representations are developed and compared. Owing to the priority of word order and semantic extraction of the neural network model Paragraph Vector, kNN based on the distributed representation generated by Paragraph Vector (kNN-PV) shows effectiveness for societal risk classification. Furthermore, to improve the performance of societal risk classification, through different weights, kNN-PV is combined with other three kNN classifiers as an ensemble model. Through brute force grid search method, the optimal weights are assigned to different kNN classifiers. Compared with kNN-PV, the experimental results reveal that Macro-F of the ensemble method is significantly improved for societal risk classification.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号