一种基于轨迹数据密度分区的分布式并行聚类方法 |
| |
引用本文: | 王佳玉,张振宇,褚征,吴晓红.一种基于轨迹数据密度分区的分布式并行聚类方法[J].中国科学技术大学学报,2018(1). |
| |
作者姓名: | 王佳玉 张振宇 褚征 吴晓红 |
| |
作者单位: | 新疆大学软件学院;新疆大学信息科学与工程学院 |
| |
摘 要: | 全球定位技术与基于位置服务的发展促进了轨迹大数据的发展.轨迹聚类作为最重要的轨迹分析任务之一,得到了广泛的研究.目前,大多数聚类方法是在单处理机模式下运行,对于大规模的轨迹数据其处理时间较长,难以满足时效性强的轨迹分析任务,为此提出一种基于轨迹数据密度分区的分布式并行聚类方法.首先将整个轨迹数据集抽象在一个矩形区域内,通过该矩形最长维度的变换将数据合理地划分为若干任务量相当的分区,构建可供分布式并行聚类的局部数据集,然后各工作服务器对局部分区分别执行DBSCAN聚类算法,管理服务器对局部聚类结果进行合并与整合.实验结果验证了本方法的有效性,在一定程度上提高了聚类分析的运算效率.
|
本文献已被 CNKI 等数据库收录! |
|