排序方式: 共有5条查询结果,搜索用时 15 毫秒
1
1.
针对电信行业客户流失问题,使用随机森林方法建立了初步的预测模型,对比电信行业原用的各种预测模型,其准确率有明显改善;针对模型特征维数众多的特点,进一步提出基于随机森林和转导推理的特征提取方法,对数据集进行降维,并引入单类支持向量机(support vector machine,SVM)算法得到最终的预测模型.实验表明,流失预测模型具有更高的预测准确率以及针对预测结果的部分可解释性. 相似文献
2.
邱一卉 《厦门大学学报(自然科学版)》2014,(6):817-823
针对电信行业客户流失预测问题的复杂性,本文将能够处理大规模数据、容噪性能较好的组合分类器算法——随机森林方法应用于电信行业的客户流失预测中.针对影响组合分类器性能的关键指标——差异度,提出了一种新的基于随机森林相似度矩阵的差异度测度,并在此基础上提出了一种改进的组合剪枝技术,对随机森林的基分类器进行剪枝,得到规模较小但泛化性能更优的基于剪枝随机森林的客户流失预测模型.实验结果表明,与其他方法相比,新的差异度测度方法更好地描述单个分类器之间的差异度,本文提出的基于剪枝随机森林的客户流失预测模型具有更高的预测准确率、更小的组合分类器规模和更好的效率,有望成为该领域一种可行且有效的方案. 相似文献
3.
从知识产权评估理论下的品牌价值评估理论入手,通过归纳法构建电影IP资源多维度评价指标体系;采用层次分析法与模糊综合评价法,对电影IP资源进行静态价值评估,并将主观化的评价等级分数合理转换成货币价值;运用实物期权理论的计算方法,对电影IP资源可能带来的预期动态价值进行测算,构建起静态价值和动态价值相结合的电影IP资源价值定量评估模型。《战狼2》IP资源价值评估的应用案例表明,该模型可实现电影IP资源价值的量化评估,为电影IP资源的交易以及电影企业投资、开发电影IP,提供直接的货币价值指导。 相似文献
4.
[目的]由于购买商品的消费者数量远小于未购买商品的消费者数量,网购意愿预测研究是典型的不平衡数据分类问题.研究不平衡数据的分类问题以提升网购意愿预测的分类准确率,该问题主要存在少数类样本识别准确率远小于多数类样本的问题.[方法]提出一种基于贝叶斯优化的代价敏感轻量梯度提升机(Light Gradient Boosting Machine, LightGBM)模型.首先引入误分类代价作为惩罚因子修正LightGBM的损失函数,其次通过阈值移动降低模型的分类阈值以提高针对少数类样本的预测准确率,最后利用贝叶斯优化算法优化误分类代价参数、分类阈值及其他参数.[结果]从KEEL数据库中选取5个典型的不平衡数据集进行对比实验,相较于标准LightGBM模型,改进LightGBM模型的AUC值和G-mean值均提升了10%左右;相较于遗传算法优化代价敏感LightGBM模型和粒子群优化代价敏感LightGBM模型,改进LightGBM模型的AUC值和G-mean值普遍提升了4%左右;相较于ADASYN-LightGBM模型和BorderlineSMOTE-LightGBM模型,改进LightGBM... 相似文献
5.
基于随机森林和转导推理的特征提取方法 总被引:1,自引:0,他引:1
提出一种基于随机森林和转导推理的特征提取方法,步骤如下:1)利用带标签的训练样本建立随机森林模型;2)将无标签的测试数据导入随机森林模型中,生成全体数据(训练样本和测试数据)的相似性矩阵;3)对该相似性矩阵进行多维尺度变换得到全体数据的低维数据表示,即低维特征,使得原高维数据在低维空间中具有更好的可分性.UCI数据库的实验结果表明:与主成分分析方法相比,该方法将无标签测试集的数据分布信息转移到相似性矩阵中,更好地刻画整个样本空间上的数据分布特性,从而提高分类器的性能,是一种行之有效的特征提取方法.最后还讨论了特征提取维数对模型准确率的影响,为实际应用提供参考. 相似文献
1