首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为降低城市出租车的空载率,缓解路网交通拥堵压力,亟需设计有效的出租车载客热门区域推荐方法.针对传统的出租车相关推荐方法忽略实际路况导致推荐精度较低的现状,提出了一个两阶段的载客热门区域实时推荐算法.首先,离线挖掘阶段,基于出租车历史轨迹数据集提取基于时段属性的载客热门区域;随后,在线推荐阶段,根据出租车请求位置及时间,结合实时路况设计潜在空载时间开销函数T_(cost)对载客热门区域进行评测排序,继而发现Top-κ载客热门区域.基于出租车轨迹数据集的实验结果表明,结合实时交通状况的Top-κ载客热门区域推荐方法以确保较小潜在空载时间开销,相较于传统的出租车推荐方法具有较好的有效性与鲁棒性.  相似文献   

2.
提出一种基于MapReduce的从出租车轨迹中提取交通热点区域的分布式并行算法,首先对原始轨迹数据进行停靠点的提取来消除噪声并剔除行驶中间点,然后通过对按时间段分块的停靠点并行运行基于密度的带有噪声的空间聚类(DBSCAN),实现对分块的数据聚类来发现不同时间段的热点区域.经过在实际数据集上的试验表明:与传统方法相比,该方法在准确性和大数据量下的整体效率具有优势.  相似文献   

3.
为充分挖掘出租车轨迹数据反映的运营规律,将城市电子地图兴趣点(point of interest,POI)数据作为影响参数纳入出租车轨迹数据研究中,探讨出租车载客运营的时空分异现象。通过处理出租车轨迹数据提取并统计各时段出租车上客量,证实出租车载客具有时间非平稳性;基于核密度估计方法对各载客高峰时段载客点聚类,分析出租车载客的空间非平稳性;构建载客热点提取模型,提取载客热点并定义热度值;从城市POI数据中筛选出显著影响载客热点分布及热度值的设施,计算其与各时段产生的载客热点的最短距离,分时段建立出租车载客地理加权回归(geographical weighted regression,GWR)模型,探讨载客热点与各类城市设施的时空关系,并以西安市出租车GPS数据为例展开实证分析,对提出的模型进行验证。结果表明:与普通线性回归模型(OLS)相比,地理加权回归模型拟合效果显著提高,拟合优度均值从0.29提高到0.57;在研究区域不同时间段,各类设施点回归系数均值存在明显时间差异,同类设施点回归系数分布存在明显空间差异;研究区域内出租车载客热点的时空分异现象大体符合城市居民出行规律,在工作日各高峰时段出租车发挥公共交通系统替补作用这一现象更为显著。研究结果可为出租车空间需求预测、出租车载客调度及价格调控精细化管理提供参考。  相似文献   

4.
针对浮动车轨迹数据包含较多异常数据导致道路网提取效果不好的问题,提出一种渐近方式的代表点插值算法.首先,采用DBSCAN聚类算法对转弯点聚类求出路口位置,计算经过两个路口间的轨迹,合并轨迹.然后,采用改进的代表点算法提取代表点.最后,利用最短路算法在由代表点建立的Delaunay三角网上插值,从而得到道路网.实验结果表明:该方法能有效地从带有较多异常的轨迹数据中取出由复杂网络构建的道路网,具有较好的实用性.  相似文献   

5.
聚类技术是数据挖掘中的一项重要技术,它能够根据数据自身的特点将集中的数据划分为簇.DBSCAN是一种经典的基于密度的聚类算法,能发现任意数量和形状的簇,但需设置Eps和MinPts参数,且聚类效果对参数敏感.提出一种改进的DBSCAN算法,该算法采用自适应的Eps参数使得DBSCAN算法能对具有不同密度的簇的数据集进行聚类.仿真实验结果验证了所提算法的有效性.  相似文献   

6.
提出了一种模糊C均值聚类和密度聚类算法相结合的方法对裂纹图像进行分割提取.使用标准的模糊C均值聚类算法来对原始图像进行初始聚类,得到包含裂纹区域的候选点.本文还提出裂纹狭长度与区域向量2种概念,并用来去除候选点中的伪裂纹.然后,利用密度聚类算法(DBSCAN算法)对候选点进行裂纹聚类,提取出最终的裂纹图像.实验结果证明,使用上述方法对裂纹图像进行分割提取可以得到很好的效果.  相似文献   

7.
以防止出租车欺诈绕路为例,提出一种基于出租车GPS时空轨迹数据离线挖掘与在线实时检测相结合的异常轨迹检测算法,获得快速反馈实时检测的结果.首先,将路网地图进行网格化切分并编号,用Pathlet方法优化常用的以GPS点组成的轨迹序列,并将轨迹通过匹配、补全等处理变换为Pathlet序列.然后,从大量出租车历史数据中,获得轨迹的Pathlet序列,并聚类得到起点与终点之间正常的K类轨迹.当实时轨迹需要被检测时,便与K类正常轨迹进行匹配,只需计算两段Pathlet序列的编辑距离,并同时考量时间和空间两个维度设定合理阈值,判断是否抛出异常.最后,基于北京地区2011年3月到5月出租车GPS轨迹的真实数据集进行了大量实验,对比了相关工作,印证了所提出算法的有效性和高效性.  相似文献   

8.
随着全球定位系统、移动互联网等技术的发展及应用普及,可以获得大量关于乘客的出行轨迹数据,但有关乘客出行目的的信息却难以获得.准确获得乘客出行目的可以更好地服务于乘客(例如基于乘客目的为乘客提供推荐服务).本文采用信息熵理论建立出租车乘客出行目的识别决策树,通过对出租车乘客出行目的的历史数据的分析,将识别结果不正确的元组改正后加入信息库,重新创建决策树,使得该方法具备了一定的学习能力,提高了出行目的识别的准确性.最后本文选取北京地区的出租车乘客数据进行实验,结果表明,该方法能够有效地对出租车乘客出行的目的进行识别.  相似文献   

9.
聚类算法是数据挖掘领域中一个非常重要的研究方向.至今为止人们已经提出了许多适用于大规模的、高维的数据库的聚类算法.基于密度的聚类算法是其中一个比较典型的研究方向,文中以DBSCAN为基础,提出一种基于密度的网格动态聚类算法.新算法将网格的原理运用到基于密度的聚类算法中,并采用了动态的参数法,能自动根据数据的分布情况进行必要的参数更改,有效减少DBSCAN对初始参数的敏感度,从而提高了聚类的效率和效果,降低了算法I/O的开销.算法不仅能挖掘出各种形状的聚类,并能准确的挖掘出数据集中突出的聚类.  相似文献   

10.
研究移动物体时空轨迹局部关键地点时空相似的聚类问题.根据移动物体的运动状态提取轨迹中的有趣地点,利用最小包围盒技术对这些有趣地点进行描述,得到基于有趣地点压缩的轨迹表示形式;然后给出一个时空属性相结合的相似性度量公式,对压缩表示的轨迹进行相似性度量;基于这个相似性度量公式对轨迹进行聚类,聚类方法采用层次聚类法.实验结果表明,本文提出的方法能有效地对移动物体时空轨迹进行聚类,由于采用了增量式的轨迹压缩方法,不仅提高了聚类的速度,而且还实现了增量式的轨迹聚类.  相似文献   

11.
多源时空轨迹数据隐含丰富的城市出行信息,通过对其进行挖掘、处理和分析,可以找到个体与群体之间的交互关系。针对轨迹数据挖掘研究范围单一,缺少多空间尺度研究的问题,提出一种融合多空间尺度特征的出行轨迹数据挖掘分析方法。以广东为例,结合社交媒体腾讯用户密度(Tencent user density, TUD)数据集,通过具有噪声的基于密度的聚类方法(density-based spatial clustering of applications with noise, DBSCAN)聚类算法与局部密度峰值计算法提取时空相似性轨迹区域,进而簇类分成一系列热点区域,获得不同时间粒度、不同空间尺度下的出行轨迹规律特征。这能够实现在不同空间尺度融合下展示同一地区的热点区域,进一步探讨出行轨迹的规律变化。可见所提出的方法为利用时空大数据进行城市空间结构研究提供科学参考。  相似文献   

12.
识别城市交通常发性拥堵区域,能够为交通管理部门和规划部门提供相应的改进建议,对城市道路网络健康运行具有重要作用。城市交通拥堵判别方法存在两个难题:基于传统检测器方法应用的局限性;基于路段级别的方法存在费工费时的地图匹配问题。针对这两个问题,提出基于车辆GPS轨迹数据的网格级别的拥堵判别方法;并利用改进的具有噪声应用的基于密度的空间聚类(density-based spatial clustering of applications with noise,DBSCAN)算法识别城市常发性拥堵区域。基于哈尔滨市城市道路网络、出租车和公交车GPS轨迹数据进行算例分析,结果表明,其能够有效判别基于网格的交通拥堵,并成功识别城市常发性拥堵区域。  相似文献   

13.
针对移动对象轨迹数据在获取过程中可能存在延迟、缺失,使得轨迹数据存在不确定性的情况.利用GM(1,1)模型在预测、决策领域中的优势,在拟合误差阀值的限制下,提出一种基于GM(1,1)模型的轨迹分割方法(TR_GMPR).之后,对分割后的轨迹段利用DBSCAN算法进行聚类.实验表明,生成的特征轨迹相比其他线段分割的轨迹聚类结果,更符合实际情况.  相似文献   

14.
基于经典流聚类框架CluStream和密度聚类算法DBSCAN,提出了一种分布式实时数据流密度聚类算法DBS-Stream,并在Storm流式处理平台上设计了算法实现方案.该算法局部节点使用CluStream的两段式经典框架,在线微聚类中利用DBSCAN代替K-means初始化数据,在中心节点再使用DBSCAN算法进行全局聚类.该算法可解决任意型聚类问题,并可使局部节点快速更新数据.将DBS-Stream算法与CluStream算法进行比较,实验结果表明,本研究算法在聚类质量和通信代价方面均优于CluStream.  相似文献   

15.
针对DBSCAN算法的不足,提出了一种基于DBSCAN的自适应聚类算法.通过引入对象密度迅速地找到数据集中的核心样本,并从核心样本出发进行统计学分析得到Eps与MinPts之间的函数关系及相关的Eps与MinPts参数值,并利用所获参数值进行自适应的聚类;采用若干个仿真和真实数据集进行实验,评估该算法的有效性和可靠性....  相似文献   

16.
全球定位技术与基于位置服务的发展促进了轨迹大数据的发展.轨迹聚类作为最重要的轨迹分析任务之一,得到了广泛的研究.目前,大多数聚类方法是在单处理机模式下运行,对于大规模的轨迹数据其处理时间较长,难以满足时效性强的轨迹分析任务,为此提出一种基于轨迹数据密度分区的分布式并行聚类方法.首先将整个轨迹数据集抽象在一个矩形区域内,通过该矩形最长维度的变换将数据合理地划分为若干任务量相当的分区,构建可供分布式并行聚类的局部数据集,然后各工作服务器对局部分区分别执行DBSCAN聚类算法,管理服务器对局部聚类结果进行合并与整合.实验结果验证了本方法的有效性,在一定程度上提高了聚类分析的运算效率.  相似文献   

17.
针对毫米波雷达数据均匀性差,数据量小,噪点多等问题,提出一种基于DBSCAN (density-based spatial clustering of applications with noise)的雷达自适应聚类算法.改进算法能够根据K近邻距离和目标反射截面自适应调整聚类半径.首先给出一种聚类半径根据K近邻距离动态调整的机制:目标第K个近邻的距离与阈值相比较,以确定阈值半径取值.再提取雷达提供的目标反射截面,基于该值计算目标假象半径作为聚类半径的补充量.实现根据目标反射截面与数据稀疏程度自适应聚类的效果.将改进算法与不同参数的DBSCAN聚类算法在真实雷达点云数据进行实验对比.相较于选取合适参数的DBSCAN算法,改进算法能够更好适应毫米波雷达点云特征,对行人目标识别准确率提高4.18%,对车辆目标识别准确率提高5.63%.  相似文献   

18.
针对传统DBSCAN算法参数设置依靠人工经验的不可靠性,并且对非均匀数据聚类效果差的问题,基于云模型(Cloud Model)提出了一种CMDBSCAN算法,算法首先结合距离曲线倾角突变的特点自适应获得邻域半径,并根据雷达信号分布密度设置聚类密度点数阈值,可实现DBSCAN算法自适应运行;同时结合多维云模型理论,对DBSCAN算法分选结果进行有效性评估,利用判定结果进一步优化参数设置.根据仿真模拟的复杂对抗过程中帧收的雷达信号进行实验,证明该算法可实现非均匀雷达信号的自适应分选,同时可有效避免在多功能雷达信号分选中的"增批"问题.  相似文献   

19.
DBSCAN方法是一种典型的基于密度的聚类算法,因此该方法具有可以发现任意形状的类的特点,但其聚类的效率并不是很高.如果考虑将传统的网格技术引入到DBSCAN聚类算法中,虽然一定程度上会提高聚类的效率,但其聚类的质量显得较为粗糙.文章通过引入自适应网格技术,使得DBSCAN聚类算法的效率和质量都有所提高.对比数值实验表明,基于自适应网格的DBSCAN聚类算法的聚类效果是良好的.  相似文献   

20.
居民出行特征分析是研究交通需求和探寻交通拥堵症结的基础手段.为研究居民出行特征,基于企事业单位人群出行特征调研数据,改进经典DBSCAN聚类算法,识别出居民出行停留点,进而结合关联规则提取出居民出行轨迹数据;根据出行轨迹数据的时空特征,分别从时空角度和功能区划分角度,挖掘出企事业人群出行时空分布规律,以及不同功能区企事...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号