基于Spark的移动用户行为轨迹大数据分析 |
| |
作者姓名: | 张嘉诚 张晓滨 |
| |
作者单位: | 西安工程大学计算机科学学院 |
| |
摘 要: | 为获取移动用户轨迹数据中的价值信息,利用Spark集群分布式处理用户行为轨迹的原始数据,对存入HBase分布式数据存储中的数据进行筛选、分析后存入Hive数据库中,Spark对数据库文件中的数据进行相关性卡方检验和K-Means聚类分析,得到用户出行方式的统计结果及在距离限制下出行方式选择的普遍规律.该过程为用户行为分析和预测提供可行的解决方案.
|
本文献已被 CNKI 等数据库收录! |
|