首页 | 本学科首页   官方微博 | 高级检索  
     

一种面向不确定数据流的聚类算法
作者姓名:韩东红  王坤  邵崇雷  马畅
作者单位:(1. 东北大学 计算机科学与工程学院, 辽宁 沈阳110169; 2. 沈阳理工大学 机械工程学院, 辽宁 沈阳110159)
基金项目:国家自然科学基金资助项目(61173029,61332006,61672144).
摘    要:作为大数据的重要组成,产生于传感器、移动电话设备、社交网络等的不确定流数据因其具有流速可变、规模宏大、单遍扫描及不确定性等特点,传统聚类算法不能满足用户高效实时的查询要求.首先利用MBR(minimum bounding rectangle)描述不确定元组的分布特性,并提出一种基于期望距离的不确定数据流聚类算法,计算期望距离范围的上下界剪枝距离较远的簇以减少计算量;其次针对簇内元组的分布特征提出了簇MBR的概念,提出一种基于空间位置关系的聚类算法,根据不确定元组MBR和簇MBR的空间位置关系排除距离不确定元组较远的簇,从而提高聚类算法效率;最后在合成数据集和真实数据集进行实验,结果验证了所提出算法的有效性和高效性.

关 键 词:不确定数据流  聚类  大数据  数据挖掘  最小边界矩形  
本文献已被 CNKI 等数据库收录!
点击此处可从《东北大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《东北大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号