期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《南京理工大学学报(自然科学版)》2021,(4)

密度峰值聚类算法(Density peaks clustering, DPC)是一种基于密度的新型聚类算法。该算法的优点十分显著:所需参数较少,没有迭代过程,能自适应获得聚类数目并识别任意形状的簇类。该算法也有一些问题亟待解决:(1)在决策图上人工选择聚类中心,产生聚类误差;(2)在密度不同的流形数据集上聚类效果不佳。针对这些不足,该文提出一种基于电子分层模型和凝聚策略的密度峰值聚类算法(Density peaks clustering based on electronic shells model and merging strategy, EMDPC)。其利用电子分层模型计算每个数据点的局部密度,更易识别出低密度簇;通过子簇凝聚策略自适应识别簇类数目,降低了人工选取聚类中心时误差发生的概率;并且子簇凝聚策略能较好地解决DPC在密度不均匀的流形数据上聚类效果不佳的问题。实验分析表明基于电子分层模型和凝聚策略的密度峰值聚类算法具有较高的精度和较好的聚类性能,其结果优于其他先进的聚类算法。相似文献

2.

密度峰值聚类算法研究现状与分析

下载免费PDF全文

葛丽娜陈园园周永权《广西科学》2022,29(2):277-286

密度峰值聚类(Clustering by Fast Search and Find of Density Peaks,DPC)算法是一种新型的基于密度的聚类算法,通过选取自身密度高且距离其他更高密度点较远的样本点作为聚类中心,再根据样本间的局部密度和距离进行聚类。一方面,虽然DPC算法参数唯一、简单、高效,但是其截断距离的取值是按经验策略设定,而截断距离值选取不当会导致局部密度和距离计算错误;另一方面,聚类中心的选取采用人机交互模式,对聚类结果的主观影响较大。针对DPC算法的这些缺陷,目前的改进方向主要有3个：改进截断距离的取值方式、改进局部密度和距离的计算方式以及改进聚类中心的选取方式。通过这3个方向的改进,使得DPC过程自适应。本文对DPC算法的自适应密度峰值聚类算法的研究现状进行比较分析,对进一步的工作进行展望并给出今后的研究方向：将DPC算法与智能算法有机结合实现算法自适应,对于算法处理高维数据集的性能也需要进一步探索。相似文献

3.

密度峰值聚类相关问题的研究

《南京大学学报(自然科学版)》2017,(4)

相对于其他的密度聚类算法,密度峰值聚类(Density Peaks Clustering,DPC)算法思想简洁新颖,所需参数少,不需要进行迭代求解,而且具有可扩展性.但是,DPC仍然具有一定缺陷,例如存在截断阈值dc的定义模糊以及选取中心点失效等问题.在阐述了DPC的算法思想和原理的基础上,分析了DPC算法的缺陷,然后从多个改进的角度对其相关研究工作进行了综述.通过分析DPC与相关理论(数据场、图论、粒计算等)的联系,针对密度峰值的缺点,提出了基于粒计算的DPC算法改进框架,其中包括由细到粗、由细到粗和双向变粒度这三种机制以及基于网格粒化的密度峰值算法框架.最后对DPC今后的研究工作进行了展望,包括动态密度峰值聚类、利用密度峰值研究网络拓扑、处理复杂任务以及改进其他聚类等,希望为DPC的进一步研究提供新思想. 相似文献

4.

融合相对密度与近邻关系的密度峰值聚类算法

代永杨张清华支学超《重庆邮电大学学报(自然科学版)》2021,33(5):791-805

密度峰值聚类算法(density peaks cluster,DPC)是一种基于密度的聚类算法,该算法可以聚类任意形状的类簇.在类簇间有密度差距的数据集上,DPC不能准确地选择聚类中心.DPC的非中心点分配策略会引起连续错误,影响算法的聚类效果.模糊k近邻密度峰值算法(fuzzy k-nearest neighbor DPC,FKNN-DPC)是一种改进的DPC算法,该算法采用边界点检测并结合2步分配策略来避免连续错误.当类簇间有密度差距时,FKNN-DPC的边界点检测效果不理想,此外,其非中心点分配策略缺乏对样本近邻信息的考虑.定义相对密度(relative density)并结合近邻关系(nearest neighbor relationship)提出RN-DPC算法解决上述问题.针对DPC因为类簇间的密度差距而不能准确选择聚类中心的问题,定义相对密度用于消除类簇间的密度差距.基于反向k近邻关系检测边界点并且引入共享最近邻关系来对FKNN-DPC的分配策略进行改进.RN-DPC算法在人工数据集和真实数据集上分别与不同的聚类算法进行了对比,实验结果验证了RN-DPC算法的有效性和合理性. 相似文献

5.

近邻密度分布优化样本分配的改进DPC聚类算法

纪霞张涛朱建磊刘诗诚李学俊《华南理工大学学报(自然科学版)》2019,47(2)

DPC算法是一种能够自动确定类簇数和类簇中心的新型密度聚类算法,但在样本分配策略上存在聚类质量不稳定的缺陷.其改进算法KNN-DPC虽然具有较好的聚类效果,但效率不高而影响实用.针对以上问题,文中提出了一种近邻密度分布优化的DPC算法.该算法在DPC算法搜索和发现样本的初始类簇中心的基础上,基于样本的密度分布采用两种样本类簇分配策略,依次将各样本分配到相应的类簇.理论分析和在经典人工数据集以及UCI真实数据集上的实验结果表明:文中提出的聚类算法能快速确定任意形状数据的类簇中心和有效地进行样本类簇分配;与DPC算法和KNN-DPC算法相比,文中算法在聚类效果与时间性能上有更好的平衡,聚类稳定性高,可适用于大规模数据集的自适应聚类分析. 相似文献

6.

基于K近邻和多类合并的密度峰值聚类算法

薛小娜高淑萍彭弘铭吴会会《吉林大学学报(理学版)》2019,57(1):111-120

针对密度峰值聚类（DPC）算法在处理结构复杂、维数较高以及同类中存在多个密度峰值的数据集时聚类性能不佳的问题, 提出一种基于K近邻和多类合并的密度峰值聚类（KM-DPC）算法. 首先利用定义的密度计算方法描述样本分布, 采用新的评价指标获取聚类中心; 然后结合K近邻思想设计迭代分配策略, 将剩余点准确归类; 最后给出一种局部类合并方法, 以防将包含多个密度峰值点的类分裂. 仿真实验结果表明, 该算法在22个不同数据集上的性能明显优于DPC算法. 相似文献

7.

一种基于仿射传播的增强型流聚类算法

《西安交通大学学报》2017,(3)

针对目前流聚类算法无法有效处理数据流离群点的检测和处理,以及增量式数据流聚类效率较低等问题,提出了一种基于密度度量的异常检测、删除的增强型仿射传播流聚类算法。在仿射传播流聚类算法的基础上,所提算法通过引进异常检测和删除机制改善了异常点对聚类精度、聚类效率的影响。利用仿射传播聚类实现在线数据流的聚类过程,同时检测数据漂移现象,即数据流分布特征随时间发生变化,并采用基于密度度量的局部异常因子检测技术(LOF)对储备池数据进行异常检测和删除处理,通过对当前类簇和处理过的储备池数据重聚类来重建动态数据流模型。在真实网络数据(KDD’99)上进行了实验,结果表明,所提算法不仅减少了重聚类构建动态模型的次数,改善了聚类效率,而且在同时考虑聚类精度、纯度和熵3种聚类评价标准下,均优于传统的仿射传播流聚类算法。相似文献

8.

基于快速聚类索引的图像检索系统 总被引：5，自引：0，他引：5

张培珍付平肖军汤旭慧《吉林大学学报(信息科学版)》2004,22(6):638-642

为了提高基于内容的图像检索系统的检索速度,提出了一个基于快速聚类索引的图像检索算法,并将其应用于视频新闻检索系统中.该算法采用Fastmap算法实现图像高维特征向量降维,并用改进后的模糊C均值聚类算法对降维后的图像进行聚类,生成图像索引.该算法用于图像检索,检索时间不会随着图像数据库中图像数量、特征向量维数的增加而增加,极大地提高了系统的检索效率,有效地解决了聚类中心初试值的选取问题.同时利用该算法构成的系统还具有动态删除、分裂、合并、插入等功能.实验结果表明,与顺序扫描算法相比,该系统不仅大大提高了检索速度,而且在图像数目和特征向量空间维数增大的条件下,仍能够获得良好的检索性能. 相似文献

9.

一种基于簇边界的密度峰值点快速搜索聚类算法

《南京大学学报(自然科学版)》2017,(2)

相比其它聚类算法,密度峰值点快速搜索聚类算法(clustering by fast search and find of density peaks,DPC)只需较少的参数就能达到较好的聚类结果,然而当某个类存在多个密度峰值时,聚类结果不理想.针对这一问题,提出一种基于簇边界划分的DPC算法:B-DPC算法.改进算法首先利用一种新的去除噪声准则对数据集进行清理,再调用DPC算法进行首次聚类.最后搜索并发现邻近类的边界样本,根据边界样本的数量和所占比例,对首次聚类结果进行二次聚类.实验证明,B-DPC算法较好地解决了多密度峰值聚类问题,能够发现任意形状的簇,对噪声不敏感. 相似文献

10.

基于密度万有引力改进的引力峰值聚类算法

陈金鹏安俊秀李睿熙《山西大学学报(自然科学版)》2023,(5):1064-1075

针对密度峰值聚类算法（DPC）中存在的截断距离难以确定、局部密度定义单一的问题，本文提出了一种基于密度万有引力改进的引力峰值聚类算法（DG-DPC算法）。该算法使用相互K近邻的方法对相似性度量和局部密度进行了重新定义，然后将引力参数引入到DPC算法中，并通过新的相对局部密度与引力参数的倒数作出决策图选取簇中心，对数据集中的点进行分配。仿真实验表明，DG-DPC算法对于人工合成数据集和UCI数据集都有效，且准确率相对于基于相对密度优化的密度峰值聚类算法（RE-DPC算法）、DPC算法、基于间隙自动中心检测的密度峰值聚类算法（GAP-DPC算法）分别平均提高了31.07%、21.60%、17.20%。相似文献

11.

基于小波压缩和用户反馈的图像检索系统

张玲王雪晶朱群雄《北京化工大学学报(自然科学版)》2006,33(1):98-101

为提高图像检索系统的准确率和有效率，本文提出一种基于小波压缩和用户反馈的图像检索方案。本系统直接对小波压缩图像进行分析，提取压缩域低频图像的颜色、纹理、形状特征，然后通过判别函数判别图像的相似性。利用检索结果的聚类性，以聚类用户反馈来提高检索系统的准确率和有效率。实验结果表明，利用颜色和纹理特征检索的效果较好，而利用形状特征检索的结果一般。相似文献

12.

基于特征点组合聚类的图像检索新方法

齐恒李克秋申彦明《大连理工大学学报》2014,54(4):477-481

由于特征点能对图像局部特征进行合理描述,有效使用特征点实现基于内容的图像检索成为当前计算机视觉领域中的热点问题.针对该问题,提出一种基于特征点组合聚类的图像检索新方法.该方法包括特征点组合聚类算法,以及基于该算法的局部颜色直方图构建策略.与现有的基于特征点和局部颜色直方图的检索方法相比,该方法能有效解决当前方法对特征点位置信息及特征点中心过度依赖的问题.从公共图像库上的实验结果可以看出,该方法与现有方法相比具有较高的检索精度. 相似文献

13.

基于空间像素强度的脑瘤图像检索方法

李清亮张子鹏时玮淞蒋振刚赵家石师为礼《吉林大学学报(理学版)》2018,56(3):676-680

针对脑瘤图像提出一种基于内容的检索方法. 首先采用图像膨胀算法增强脑瘤图像的感兴趣区域(ROI); 然后基于点的空间像素强度的特征提取方法, 描述脑瘤图像增强后的ROI局部特征; 最后引入聚合特征算法提高图像特征的辨别能力和压缩能力. 实验对比3种脑瘤图象检索方法的结果表明, 该算法可得到较高的检索精确度, 可实现高效、准确的脑瘤图像检索. 相似文献

14.

基于RGB分量小波分解的数字图书馆图像检索技术

何蕾《韶关学院学报》2013,34(4):14-18

图像检索技术是数字图书馆进一步发展的核心技术,目前主要受到检索准确度和检索速度之间矛盾的制约.为此提出了一种基于RGB分量小波分解的图像检索方法.首先,利用原始图像信息生成RGB三色分量图像.然后,将每一幅分量图像进行小波分解,求取其低频分量成分.最后,利用RGB三色分量图像的低频成分进行融合,生成最终的相似性测度.实验结果表明,此方法可以在确保准确性的前提下,快速地实现图像检索. 相似文献

15.

一种改进的多光谱遥感图像超像素分割算法

任伟建刘泽宇霍凤财康朝海任璐张永丰《吉林大学学报(理学版)》2022,60(2):351-360

针对简单线性迭代聚类算法在多光谱遥感图像超像素分割中存在的未充分利用图像特征信息及超像素尺寸、数量固定导致分割精度较低的问题, 提出将流形简单线性迭代聚类算法引入到遥感图像超像素分割任务中, 并对其进行改进. 首先, 给出一种基于彩色局部二进制模式改进的多光谱遥感图像纹理特征提取方法; 其次, 扩展流形简单线性迭代聚类算法的光谱空间, 使算法可以适应高维图像数据; 最后, 改进流形简单线性迭代聚类算法的聚类距离度量, 融合图像的多段光谱特征、空间特征及纹理特征对像素进行迭代聚类, 实现内容敏感超像素分割. 实验结果表明, 与现有方法相比, 该算法对多光谱遥感图像的超像素分割结果更准确, 在边缘召回率、欠分割误差、可达细分精度指标上均有提升, 能改善多光谱遥感图像分割预处理方法中精度较低的问题. 相似文献

16.

基于支持向量机和用户反馈的图像检索算法

谭翔纬《吉林大学学报(理学版)》2020,58(4):899-905

针对当前图像检索算法存在精度低、实时性差等不足, 为了获得更理想的图像检索结果, 提出一种基于支持向量机和用户反馈机制的图像检索算法. 首先采集大量图像, 提取图像检索的相关特征, 建立图像检索特征库；然后采用支持向量机计算待检索图像特征与图像检索库特征之间的相似度, 确定图像类别, 实现图像的初步检索；最后引入用户反馈机制对图像的初步检测结果进行精细比对, 并与经典图像检索算法进行对比实验. 实验结果表明, 该方法的图像检索精度超过90%, 图像检索误差远小于经典图像检索算法, 提高了图像检索效率. 相似文献

17.

基于高阶相关聚类的脱机手写文本行分割

殷亚林刘爱民周祥东《华中师范大学学报(自然科学版)》2017,51(1):18-22

从手写文档图像中提取出文本行是文档分析的一个重要预处理步骤,但是由于手写文本行之间通常行方向不平行,甚至存在着交叠和弯曲,所以它仍然是一个具有挑战性的问题. 针对该问题,提出了一种基于高阶相关聚类的脱机中文手写文本行的分割算法.首先,使用连通部件构成一个文档超图,然后,在学习所得的相似性度量准则的约束下,通过高阶相关聚类算法将连通部件对标记为属于或者不属于同一文本行;最后,使用unionfind算法将连通部件连接成为不同的文本行.该算法在HITMW脱机手写数据库上的803幅文档上取得了较好的效果,召回率99.05%,错误率为1.96%. 相似文献

18.

基于内容的彩色细胞图像检索 总被引：2，自引：0，他引：2

周光泉姜璐罗立民鲍旭东《东南大学学报(自然科学版)》2004,34(5):669-674

提出了一种结合颜色、纹理和形状特征的细胞病理图像检索方法．首先,运用K-均值聚类方法提取出细胞核,并且采用多域值分割算法去除细胞图像中的背景区域．提取的特征包括颜色、纹理和形状等,这些特征能很好地表征单核细胞的主要特性．由于提取的特征数值范围以及物理意义不尽相同,对特征进行了归一化处理．最后提出了相关的反馈系统．该系统可以自动地调整不同特征的权值,提高了图像检索的准确率．运用该方法进行细胞图像的检索更符合人的视觉感觉要求,比仅仅提取一个特征的方法更加准确．相似文献

19.

基于聚类和双向门控循环单元条件随机场的多类型流式文档结构识别

王娟李宁姜雨彤田英爱《科学技术与工程》2021,21(17):7208-7216

流式文档结构识别对于文档自动排版和优化、信息检索等领域有着重要作用.以往针对流式文档结构识别主要集中于学术论文领域,对于其他诸如公文、报告等多类型的文档结构识别研究较少.针对此现状,使用聚类的方法对文档进行分类,在此基础上提出了针对不同文档分类的、基于双向门控循环单元-条件随机场(bidirectional gated recurrent unit-conditional random field,BIGRU-CRF)的文档结构识别方法,以此来解决多类型文档结构识别的问题.实验结果表明,该方法不仅能够提高学术论文结构识别的效果,对其他类型的文档结构也能够进行较好地识别. 相似文献