期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

赵文夏桂书苟智坚闫振兴《四川师范大学学报(自然科学版)》2013,(2):312-316

聚类技术是数据挖掘中的一项重要技术,它能够根据数据自身的特点将集中的数据划分为簇.DBSCAN是一种经典的基于密度的聚类算法,能发现任意数量和形状的簇,但需设置Eps和MinPts参数,且聚类效果对参数敏感.提出一种改进的DBSCAN算法,该算法采用自适应的Eps参数使得DBSCAN算法能对具有不同密度的簇的数据集进行聚类.仿真实验结果验证了所提算法的有效性. 相似文献

2.

一种文本聚类算法

李向军徐国华刘立平《西北大学学报(自然科学版)》2005,35(2):155-158

目的通过对现有聚类常用算法的研究，给出一种适用于大规模中本数据集聚类的算法DBTC(density-based text clustering)。方法采用在DBSCAN算法基础上改进提出的DBTC算法，对中本数据集进行聚类。结果 DBTC算法可以发现任意形状的簇，对中本聚类的准确率高达80％以上。结论经过分析和实验证明DBTC算法比基本的DBSCAN算法更适合于大规模数据集。相似文献

3.

一种改进的毫米波雷达聚类算法

鞠夕强孟文孟祥印谢江鹏《科学技术与工程》2021,21(20):8537-8543

针对毫米波雷达数据均匀性差,数据量小,噪点多等问题,提出一种基于DBSCAN (density-based spatial clustering of applications with noise)的雷达自适应聚类算法.改进算法能够根据K近邻距离和目标反射截面自适应调整聚类半径.首先给出一种聚类半径根据K近邻距离动态调整的机制:目标第K个近邻的距离与阈值相比较,以确定阈值半径取值.再提取雷达提供的目标反射截面,基于该值计算目标假象半径作为聚类半径的补充量.实现根据目标反射截面与数据稀疏程度自适应聚类的效果.将改进算法与不同参数的DBSCAN聚类算法在真实雷达点云数据进行实验对比.相较于选取合适参数的DBSCAN算法,改进算法能够更好适应毫米波雷达点云特征,对行人目标识别准确率提高4.18％,对车辆目标识别准确率提高5.63％. 相似文献

4.

考虑对象方向关系的密度聚类算法 总被引：2，自引：0，他引：2

黄永平王丽珍《云南大学学报(自然科学版)》2004,26(3):216-219

聚类分析是数据挖掘的一个重要研究方向.为了在大规模空间数据库中发现任意形状的聚类,Martin Ester等提出基于密度的聚类算法DBSCAN.针对DBSCAN处理聚类边界对象的不足,提出了聚类时考虑对象方向关系的改进算法,实验表明,改进算法在不改变时间、空间复杂度的情况下能得到更好的聚类结果. 相似文献

5.

分级与密度相结合的Web文本聚类算法

林国平《太原师范学院学报(自然科学版)》2008,7(3):45-48

考虑到实验数据的大规模及样本数据形状的复杂性等特点,提出一种基于分级聚类与DBSCAN聚类相结合的HL-DBSCAN聚类算法,避免了DBSCAN的聚类算法较大的时间复杂度,适用性更广,更能体现一个聚簇的规律,提高分类精度.通过实验与结果分析,取得较好的聚类结果,证明了该算法在文本聚类处理中的可行性. 相似文献

6.

分区基于密度的聚类算法在激光雷达行人检测系统中的应用

《科学技术与工程》2017,(18)

行人检测过程中原始DBSCAN算法不能正确地对密度不均匀的激光点云聚类,产生错误的聚类结果导致行人检测系统出现误检和漏检。为解决这一问题,基于激光雷达的行人检测系统在原始密度聚类算法DBSCAN的基础上提出了分区DBSCAN算法。该算法将密度不均匀的点云数据划分为若干个密度相对均匀的分区,从而能实现对行人的快速准确检测。实验结果表明原始DBSCAN算法行人检测率为62.47%,使用分区DBSCAN算法的激光雷达行人检测系统行人检测率达到82.21%,相对于原始DBSCAN算法检测精度提高了19.74%;而且在时间消耗上也比原始DBSCAN算法降低了16.22%。相似文献

7.

分区DBSCAN算法在激光雷达行人检测系统中的应用

宋柱付锐张名芳赵佳《科学技术与工程》2017,17(18)

摘要行人检测过程中原始DBSCAN算法不能正确地对密度不均匀的激光点云聚类,产生错误的聚类结果导致行人检测系统出现误检和漏检。为解决这一问题,基于激光雷达的行人检测系统在原始密度聚类算法DBSCAN的基础上提出了分区DBSCAN算法。该算法将密度不均匀的点云数据划分为若干个密度相对均匀的分区,从而能实现对行人的快速准确检测。实验结果表明原始DBSCAN算法行人检测率为62.47%,使用分区DBSCAN算法的激光雷达行人检测系统行人检测率达到82.21%,相对于原始DBSCAN算法检测精度提高了19.74%;而且在时间消耗上也比原始DBSCAN算法降低了16.22%。相似文献

8.

基于spark框架的DBSCAN文本聚类算法

宁建飞《汕头大学学报(自然科学版)》2018,(2)

针对DBSCAN算法性能上的瓶颈以及内存和I/O上的消耗严重,提出了一种大数据计算框架的并行聚类方案.选用Spark计算框架对DBSCAN算法进行并行化改进,利用SNN相似度图解决DBSCAN算法对高维数据密度定义模糊的问题,并且将DBSCAN算法运行在spark计算平台上,缓解了内存的不足.实验结果证明,该解决方案相对于单机的DBSCAN算法,聚类精度没有下降,并且通过横向的添加节点增加了运行内存,在缓解内存紧张的前提下降低了算法运行时间,和基于Hadoop的DBSCAN算法相比也有较好的加速比. 相似文献

9.

一种基于密度的增量 k-means 聚类算法研究

司福明《长春工程学院学报(自然科学版)》2016,17(2):99-102

介绍了 k -means 和 DBSCAN 聚类算法的基本原理和优缺点,针对传统聚类算法无法有效处理高维混合属性数据集的问题,对原有的数据归一化方法进行改进,在 k -means 和 DBSCAN 聚类算法的基础之上,结合增量聚类的思想和数据之间相异度的计算方法,提出了基于密度的增量 k -means 聚类算法,有效处理具有高维混合属性的数据集,改进了数据相异度的计算方法。相似文献

10.

基于Storm的分布式实时数据流密度聚类算法

牛丽媛张桂芸《天津师范大学学报(自然科学版)》2018,(3)

基于经典流聚类框架CluStream和密度聚类算法DBSCAN,提出了一种分布式实时数据流密度聚类算法DBS-Stream,并在Storm流式处理平台上设计了算法实现方案.该算法局部节点使用CluStream的两段式经典框架,在线微聚类中利用DBSCAN代替K-means初始化数据,在中心节点再使用DBSCAN算法进行全局聚类.该算法可解决任意型聚类问题,并可使局部节点快速更新数据.将DBS-Stream算法与CluStream算法进行比较,实验结果表明,本研究算法在聚类质量和通信代价方面均优于CluStream. 相似文献

11.

基于路标的智能车辆定位 总被引：1，自引：0，他引：1

钱钧杨汝清王晨周启龙杨明《上海交通大学学报》2007,41(6):894-898

为解决智能车辆在城市环境中的定位问题,使用激光雷达检测和提取圆柱形路标的中心位置,并与已知地图进行数据关联;以CyberC3智能车辆为移动平台,建立了车辆运动模型和传感器测量模型,使用扩展卡尔曼滤波算法对激光雷达和编码器数据进行融合,计算车辆的全局位姿.实验结果证明该方法可以获得较高的定位精度,解决了车辆自主导航的关键问题,并可推广应用到基于自然特征的全局定位. 相似文献

12.

车载激光扫描仪外参数标定方法设计与实现

姚连璧汪志飞孙海丽《同济大学学报(自然科学版)》2016,44(1):0161-0166

提出了车载移动测量系统中激光扫描仪位置和姿态的标定方法.首先,定义了车载坐标系与激光扫描仪坐标系,将扫描仪的标定简化为2个坐标系转换参数的求取.然后,利用标准靶球球心和扫描仪特征点作为公共点,借助全站仪建立的临时水平坐标系的测量结果计算得到车载坐标系与扫描仪坐标系的转换参数.最后,通过多次试验分析了该方法的重复精度,而且在逸仙高架路上的实际车载数据采集和处理也验证了该方法的可行性. 相似文献

13.

基于DBSCAN聚类的改进KNN文本分类算法

苟和平《科学技术与工程》2013,13(1):219-222

K最近邻算法(KNN)在分类时,需要计算待分类样本与训练样本集中每个样本之间的相似度.当训练样本过多时,计算代价大,分类效率降低.因此,提出一种基于DBSCAN聚类的改进算法.利用DBSCAN聚类消除训练样本的噪声数据.同时,对于核心样本集中的样本,根据其样本相似度阈值和密度进行样本裁剪,以缩减与待分类样本计算相似度的训练样本个数.实验表明此算法能够在保持基本分类能力不变的情况下,有效地降低分类计算量. 相似文献

14.

DBSCAN算法在高性能计算中心用户分类的应用研究

徐海啸麻婧吴旗《吉林大学学报(信息科学版)》2013,31(5):528-534

为提高集群资源使用效率, 管理员需要对用户进行分类, 从而对不同用户提出资源使用策略。DBSCAN(Density Based Spatial Clustering of Applications with Noise)聚类算法可对用户进行分类, 但对初始参数敏感。为此, 提出改进算法, 首先将密度进行层次划分, 由此得出各层次的密度阈值, 在每种阈值下采用DBSCAN算法, 解决全局参数问题。在此基础上, 创新地使用一个直接可达距离排序队列, 将排序信息作为可变参数, 减小初始参数对结果的影响。通过高性能计算中心用户数据的实例验证了其可行性。实验结果表明, 改进后的算法提高了用户分类的准确性和全面性。相似文献

15.

基于乘客需求数据的定制商务班车站点选址方法

孙悦宋瑞邱果《山东科学》2019,32(1):102-112

针对基础的聚类算法无法适应定制商务班车站点设置的问题,在传统的基于密度的带有噪声的空间聚类算法基础上,通过衡量类簇精细化服务指标确定分组效果,并对聚类效果不理想的组别依据其数据特征自动更新以扫描半径和最小包含点数为代表的聚类参数,进行迭代聚类,直到聚类效果达标为止。同时,结合节点重要度的思想改进基于密度的带有噪声的空间聚类算法,使其能够输出备选站点。研究结果表明,改进的算法能够较好地根据数据特征给出应有分组,给出的扫描半径和最小包含点参数能够较好地适应分组情况,备选节点能够有效地匹配周围的交通资源。相似文献

16.

基于并查集的DBSCAN算法设计

张晓《伊犁师范学院学报(自然科学版)》2014,(4):62-65

DBSCAN算法是经典的基于密度的聚类算法,能够在含有噪声的数据中发现任意形状的簇,但其效率较低．并查集常用于解决不相交集合的合并问题,将并查集的方法应用于DBSCAN算法的设计中,使得算法效率得到有效提高．相似文献