基于有效特征选择的高价值移动通信用户预测方法 |
| |
作者姓名: | 余自林 张晓龙 |
| |
作者单位: | 1. 武汉科技大学计算机科学与技术学院,湖北 武汉,430065;2. 武汉科技大学智能信息处理与实时工业系统湖北省重点实验室,湖北 武汉,430065,1. 武汉科技大学计算机科学与技术学院,湖北 武汉,430065;2. 武汉科技大学智能信息处理与实时工业系统湖北省重点实验室,湖北 武汉,430065 |
| |
基金项目: | 国家自然科学基金资助项目(60975031). |
| |
摘 要: | 高价值移动通信用户预测是电信客户关系管理中的一项重要内容。针对建立预测模型时遇到的高维、大规模、类不平衡等数据处理问题,提出了一种基于有效特征选择的预测方法。利用欠采样方式从初始不平衡数据集提取多个平衡训练集,使用结合Pearson相关性分析和随机森林特征重要性评估的特征选择策略,在集成学习方法中嵌入加权和投票机制获得最优的特征子集,最后采用随机森林算法建立预测模型。实验结果表明,该预测模型可以有效降低特征集的维度并提升对高价值移动通信用户的预测性能。
|
关 键 词: | 移动通信用户 不平衡数据集 特征选择 Pearson相关分析 随机森林 预测模型 |
收稿时间: | 2017/1/6 0:00:00 |
Prediction for high-value mobile communication users based on efficient feature selection |
| |
Authors: | Yu Zilin and Zhang Xiaolong |
| |
Institution: | 1. College of Computer Science and Technology, Wuhan University of Science and Technology, Wuhan 430065, China;2. Hubei Province Key Laboratory of Intelligent Information Processing and Real-time Industrial System, Wuhan University of Science and Technology, Wuhan 430065, China and 1. College of Computer Science and Technology, Wuhan University of Science and Technology, Wuhan 430065, China;2. Hubei Province Key Laboratory of Intelligent Information Processing and Real-time Industrial System, Wuhan University of Science and Technology, Wuhan 430065, China |
| |
Abstract: | |
| |
Keywords: | mobile communication user imbalanced dataset feature selection Pearson correlation analysis random forest prediction model |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《》浏览原始摘要信息 |
| 点击此处可从《》下载免费的PDF全文 |
|