期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陈西江安庆班亚王德欣李坤刘海鹏《应用科学学报》2022,(3):411-422

针对聚类算法的聚类中心重复性和无法对点云聚类的问题,提出了融合高斯核及指数函数的聚类中心均匀化的点云聚类方法,以优化聚类中心的均匀化分布,实现点云的均匀化聚类。首先,根据高斯核函数及密度指数函数确定局部密度,再依据局部密度的大小确定距离参数。其次,依据局部密度和距离参数的乘积确定聚类中心,同时消除聚类中心的邻近化,使得聚类中心更加均匀分布于整个数据集中。最后,利用数据点到聚类中心距离逐个确定每个数据的聚类归属,并合并邻近聚类实现点云目标物的提取。将该算法与常规的基于密度峰值的聚类算法（clustering function based on density peak, CFDP）、K-means聚类算法、具有噪声的基于密度的聚类方法（density-based spatial clustering of applications with noise,DBSCAN）进行比较,该文所提方法可以对教室内3排椅子实现100%的提取。与相对密度关系的峰值聚类（density peak clustering, DPC）算法及深度学习方法相比,所提方法对不同分辨率目标物点云的提取精度均为96.7%... 相似文献

2.

融合高斯核及指数函数聚类的点云目标物提取

陈西江安庆班亚王德欣李坤刘海鹏《应用科学学报》2021,40(3):411-422

针对聚类算法的聚类中心重复性和无法对点云聚类的问题,提出了融合高斯核及指数函数的聚类中心均匀化的点云聚类方法,以优化聚类中心的均匀化分布,实现点云的均匀化聚类。首先,根据高斯核函数及密度指数函数确定局部密度,再依据局部密度的大小确定距离参数。其次,依据局部密度和距离参数的乘积确定聚类中心,同时消除聚类中心的邻近化,使得聚类中心更加均匀分布于整个数据集中。最后,利用数据点到聚类中心距离逐个确定每个数据的聚类归属,并合并邻近聚类实现点云目标物的提取。将该算法与常规的基于密度峰值的聚类算法（clustering function based on density peak,CFDP）、K-means聚类算法、具有噪声的基于密度的聚类方法（density-based spatial clustering of applications with noise,DBSCAN）进行比较,该文所提方法可以对教室内3排椅子实现100%的提取。与相对密度关系的峰值聚类（density peak clustering,DPC）算法及深度学习方法相比,所提方法对不同分辨率目标物点云的提取精度均为96.7%,在计算效率和精度方面均优于其他两种方法。相似文献

3.

基于数据挖掘技术的湖南省县域乡村分类分析

丁玲屈晶晶王文强《湘潭大学自然科学学报》2019,(1):110-120

以数据挖掘为工具,结合县域经济发展理论,探究湖南省县域经济发展聚集态势.构建了湖南省县域经济发展评价指标体系,对数据集应用基于原型的二分K均值聚类、基于图的AGNES聚类、加权主成分距离聚类与基于密度的DBSCAN聚类,根据邻近度矩阵的相关度选择最优聚类方法 .结果显示,湖南省县域经济发展按特征可归为四类,各类县市特征显著,类别间发展差距较大.根据模型的理论结果对现有的湖南省政府乡村振兴三大发展梯队的划分进行调整,为地方政府实施乡村振兴战略提供一定的理论基础,具有较好的参考价值. 相似文献

4.

基于云计算平台Hadoop的HKM聚类算法设计研究

张淑芬董岩岩陈学斌《应用科学学报》2018,(3)

为有效解决传统K-means聚类算法在处理大规模数据集时面临的扩展性问题,提出了一种Hadoop K-means聚类算法.该算法首先根据样本密度剔除数据集中孤立点或者噪声点的影响,再利用最大化最小距离思想选取K个初始中心,使初始聚簇中心点最优化,最后用Hadoop云计算平台的Map Reduce编程模型实现算法的并行化.实验结果表明,该算法不仅在聚类结果上具有较高的准确率和稳定性,而且能够很好地解决传统聚类算法在处理大规模数据时所面临的扩展性问题. 相似文献

5.

结合上下文特征和图割算法的车载点云聚类方法 总被引：1，自引：1，他引：0

刘亚文张颖《应用科学学报》2020,38(6):924-935

可靠、准确的点云聚类是后续高精度场景目标分析与解译的基础.该文提出了一种基于上下文特征和图割算法的车载点云聚类方法.首先用DBSCAN(density-based spatial clustering of applications with noise)对点云数据进行过分割,得到密度可达的超体素;然后引入空间和属性上下文特征来描述超体素间的关联,并用于定义超体素构建的图模型边的权值;最后基于多标记的图割优化算法得到最佳超体素聚簇.实验结果表明,该方法能够有效改善点云聚类过分割,从而提高聚类的精度. 相似文献

6.

基于密度峰值剪枝后的最短路径聚类算法

胡恩祥汪春雨潘美芹《应用科学学报》2020,38(5):792-802

聚类是通过数据标签或者属性,将一系列经验数据按照相似性或者相近性进行归类.基于密度属性展开的聚类算法,主要聚焦在聚类中心的确定和剩余点如何分配的问题上展开讨论.针对基于密度峰值的可训练最短路径算法,通过密度峰值确定聚类中心,提出使用截断阈值、对路径图进行剪枝的算法改进.然后基于最短路径法对剩余点进行全局分配.实验结果证明,在保持聚类精度的同时,有效地提升了算法执行效率. 相似文献

7.

改进K-means算法对大兴安岭蓝莓干销售预测的应用

《黑龙江大学自然科学学报》2017,(2)

K-means算法对噪音数据和孤立点敏感,致使其在应用方面存在很大的局限。传统的Kmeans算法在除噪阶段多以人为和经验判定噪音点或单纯从平均数角度剔除孤立点,造成聚类结果准确度难以保证。以大兴安岭地区精品蓝莓干商品为研究对象,基于DBSCAN算法辅助Kmeans算法去噪,用定量的方法解决K-means去噪欠缺合理性的问题。结合ARIMA模型加以验证聚类预测的结果,与实际值匹配度达到95%以上,明显高于未改进算法。相似文献

8.

基于改进K均值聚类的银行客户分类算法

于化龙韩雪峰《湘潭大学自然科学学报》2018,(3):125-126

为了提高银行客户分类的正确率,使银行的收益最大化,提出一种基于改进K均值聚类的银行客户分类算法.算法定义了类间最大相似度均值(AMS),并根据该定义确定最佳聚类数.当计算出的当下AMS值比前一次的AMS值小时,根据距离原则选择初始聚类中心;当计算出的当下AMS值比前一次的AMS值大时,把该最小AMS值相匹配的聚类中心看作初始聚类中心.利用最佳聚类数和初始聚类中心实现银行客户的细分.仿真结果表明,提出的算法能够跳出局部最优,并提高客户分类的正确率. 相似文献

9.

基于局部密度估计的聚类个数确定研究

《河南科技》2016,(9)

随着人工智能和数据挖掘技术的兴起,聚类分析已被广泛应用于通信、文本数据统计、生物信息学和图像处理中。对于非监督聚类分析,聚类的分类数目是决定聚类质量的关键因素。通常聚类个数事先无法确定,随即选择的初始聚类中心容易使聚类结果不稳定。针对此,基于聚类中心具有高局部密度且距高局部密度聚类中心距离较远的特点,提出一种基于局部密度估计的聚类个数的估计方法。经过仿真实验,验证了该算法具有良好的有效性和鲁棒性。相似文献

10.

一种发现社团结构的快速凝聚聚类算法

贾宗维崔军《湘潭大学自然科学学报》2012,(4):103-107

为了快速探测复杂网络中的社团结构,提出了基于网络节点耦合度的凝聚聚类算法.首先利用一种优化的聚类中心算法确定初始聚类中心节点,然后根据节点间耦合程度和节点度分别对各社团的节点进行分类和不断调整聚类中心,直至聚类算法结束.实验结果表明,该算法能够快速准确的划分复杂网络中的各社团. 相似文献

11.

一种大规模高维数据集的高效聚类算法

周晓云孙志挥张柏礼《应用科学学报》2006,24(4):396-400

大规模高维数据集的聚类算法已成为当前聚类研究的热点,由于高维的原因,聚类往往隐藏在数据空间的某些子空间中,传统的聚类算法无法获得有意义的聚类结果.此外,高维数据中含有的大量的随机噪声也会带来额外的效率问题.为了解决以上问题,该文在CLIQUE算法的基础上提出了一种基于最优区间分割和数据集划分的聚类算法—OpCluster,并使用仿真数据对该算法加以验证,实验结果表明,OpCluster对大规模高维数据集具有很好的聚类效果. 相似文献

12.

一种基于改进径向基神经网络的人脸图像识别方法

王阳萍朱正平孙传庆《甘肃科学学报》2006,18(2):62-65

常用于径向基神经网络中心参数学习的K-均值聚类算法,易受初始参数选取的影响而收敛于局部极小值.将自动终止聚类判据的减聚类算法用于径向基网络的学习,可根据样本集确定径向基函数数目,且其计算量与数据点的数目与考虑问题的维数无关,很适合于人脸这种维数较高的模式.实验证明,应用这种算法训练径向基神经网络识别人脸,从识别精度到识别速度上都优于传统算法. 相似文献

13.

基于层次聚类法的Entropy-KNN算法

童先群周忠眉《漳州师院学报》2012,(1):43-47

KNN算法通过近邻样本的个数分类,Entropy-KNN算法给出新的相似度定义,而且投票时综合待测样本与近邻样本的个数和各类近邻的平均距离,但两种算法均未考虑近邻样本间的相似.提出的基于层次聚类法的Entropy-KNN算法,首先对训练集按类别进行层次聚类,接着在与待测样本最相似的子类中选取近邻样本,使得近邻样本具有较高的相似度,最后结合Entropy-KNN算法进行分类.在蘑菇数据集上的实验结果表明,该算法的分类准确率高于Entropy-KNN算法. 相似文献

14.

图书馆大规模日志数据的快速聚类 总被引：2，自引：0，他引：2

宋爱波庄晓青何洁月业宁董逸生《应用科学学报》2003,21(3):284-288

给出了一种简单有效的算法，用于对图书馆大规模日志数据的快速聚类和借阅趋势分析。首先，根据读者基本的借阅规律，把日志数据聚成若干子类，然后，给出了对子类结果进行再次聚类的模糊算法。最后，为了预测读者的借阅趋势，对每一类进行了回归分析。该算法具有线性复杂度，对大规模数据集是可伸缩的，实验证明是可行的。相似文献

15.

基于遗传算法的可变加权FCM聚类方法改进研究 总被引：2，自引：2，他引：0

陈孝国《高师理科学刊》2011,31(1):12-15

模糊C均值聚类(FCM)应用广泛,但是它容易陷入局部最优,且对初始值很敏感.利用遗传算法对模糊聚类中聚类中心的个数和聚类中心的选取进行了确定,然后在FCM法中引入指标权重,并给出迭代公式和相应算法.实验结果表明,该方法可以在一定程度上避免FCM算法对初始值敏感和容易陷入局部最优解的缺陷,使聚类更合理,效果很好. 相似文献

16.

PBC:一种基于路径的XML文档聚类方法 总被引：2，自引：0，他引：2

梁作鹏业宁董逸生《应用科学学报》2005,23(4):399-403

提出了一种基于路径的XML文档结构聚类方法(PBC).与其他方法直接计算XML文档结构距离不同,该方法通过对文档包含的路径聚类,间接完成文档的聚类.首先,包含某一路径的文档集合形成初始类,并用该路径作为初始类的标识.然后,用层次聚类方法根据设定的标准,合并初始类,直至结束.类的标识信息是类中文档包含的路径,结果直观,容易理解.算法的复杂度是O(n),其中n是文档的大小.相关实验证明该算法不但能保证聚类结果准确,而且能大幅度提高计算的速度. 相似文献

17.

基于加权特征的无监督模糊聚类入侵检测研究

周铁军李新宇《湘潭大学自然科学学报》2011,33(1):98-102

鉴于网络入侵检测数据样本特征属性的异构性及贡献率不同,提出一种加权特征的异构数据相似性度量法来反应网络数据样本间的相似程度.针对基于模糊C-均值聚类的网络入侵检测算法聚类数目难以确定的问题,提出了一种自动确定最佳聚类数的无监督模糊聚类入侵检测算法.通过KDDcup1999数据集的仿真对比实验,结果表明本文算法能找到最佳... 相似文献