首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
利用测地线距离的改进谱聚类算法   总被引:1,自引:1,他引:0  
针对往复式压缩机故障数据空间分布复杂、常规算法不能有效聚类的问题,提出了一种改进的谱聚类算法.该算法使用新的相似度矩阵计算方式,根据故障数据流形分布的特点引入测地线距离取代欧氏距离作为数据间的关系度量;通过计算各数据点的邻域密度因子有效地识别和剔除了噪声点;利用基于密度的局部欧氏距离调整方法对流形间隙过小的区域进行了处理.在几个人工数据集和往复式压缩机故障数据集上的测试结果表明,改进谱聚类算法对于具有流形分布、多尺度、有噪声、流形间隙过小甚至交叉等特点的数据具有很好的聚类能力,聚类准确率比常规的k-均值和MSCA谱聚类算法分别提高了50.86%和8.6%.  相似文献   

2.
针对图形模糊聚类算法缺乏噪声抑制能力的不足,提出基于鲁棒距离的自适应图形模糊聚类分割算法.首先,将邻域像素灰度信息嵌入图形模糊聚类目标函数,得到鲁棒图形模糊聚类分割算法.然后,利用鲁棒距离代替鲁棒图形模糊聚类目标函数中的平方欧氏距离,并对该鲁棒聚类中正则因子采用当前样本与邻域信息均值之偏差进行自适应调节.最后,利用拉格朗日乘子法获得自适应鲁棒图形模糊聚类迭代表达式.灰度图像及其噪声干扰图像的分割测试结果表明:该分割算法相比图形模糊聚类算法、鲁棒图形模糊聚类算法以及现有的鲁棒模糊聚类算法等具有更强的分割能力和抑制噪声的能力.  相似文献   

3.
密度峰值聚类算法(DPC)具有准确率高、自动检测类别个数、识别中心点数目等优良性质.由于DPC算法用欧氏距离度量样本点之间的邻近关系,导致无法有效地提取高维复杂数据中的流形结构信息.针对密度峰值聚类算法的这个瑕疵,考虑到数据点之间的几何特性和流形结构,以测地距离替代欧氏距离,设计了一种改进的密度峰值聚类算法.数值模拟结果显示,改进的密度峰值聚类算法能够有效地处理具有流形分布特征的数据聚类问题.  相似文献   

4.
快递配送区域划分是城市内快递网络优化的基础,客户的空间距离和基层站点的配送能力是配送区域划分的主要考虑因素.针对客户分布已知的快递配送区域划分,提出了考虑河流、公路等地理障碍和站点工作量的约束聚类算法.利用提出的"障碍距离",克服传统欧氏距离不能表征实际地理信息的缺陷,并设计BSP树快速实现点的可视化判断.在此基础上,利用约束聚类的思想对传统K-means算法进行改进,使其在考虑地理信息的同时,能够满足站点业务量约束.利用生成数据和实际数据分别对算法进行了数值实验.  相似文献   

5.
半监督学习是近年来机器学习领域中的一个重要研究方向,其监督信息的质量对半监督聚类的结果影响很大,主动学习高质量的监督信息很有必要.提出一种纠错式主动学习成对约束的方法,算法通过寻找聚类算法本身不能发现的成对约束监督信息,将其引入谱聚类算法,利用该监督信息来调整谱聚类中点与点之间的距离矩阵.采用双向寻找的方法,将点与点间距离进行排序,使得学习器即使在接收到没有标记的数据时也能进行主动学习,实现了在较少的约束下可得到较好的聚类结果.同时,该算法降低了计算复杂度,并解决了聚类过程中成对约束的奇异问题.通过在UCI基准数据集以及人工数据集的实验表明,算法的性能好于相关对比算法,并优于采用随机选取监督信息的谱聚类性能.  相似文献   

6.
一种改进的聚类和孤立点检测算法   总被引:1,自引:0,他引:1  
对基于距离的聚类及基于密度的孤立点检测方法进行了分析研究,提出了一种基于距离和密度的聚类和孤立点检测算法DDBCOD.该算法根据距离和密度阈值对数据进行聚类,并发现数据中的孤立点.实验表明,该算法能够识别任意形状的聚类,对高维数据有效,能够很好地识别出孤立点.  相似文献   

7.
针对含有文字信息的文档被纵切或被纵横切后碎纸片的拼接复原,运用灰度图像原理、欧式距离理论及数据聚类算法等方法,结合设计的算法分别建立欧氏距离匹配模型与类数据聚类的欧氏距离匹配模型,利用M atlab软件编程处理,给出仅纵切或纵横切的中文和英文文档拼接复原的处理办法,并对该处理办法进行相应的推广和展望。  相似文献   

8.
提出了一种顾及障碍物的欧氏距离变换方法.该方法基于栅格扫描方式进行距离变换,逐行逐列传播距离值,并在距离传播过程中进行可见性检测,从而使距离传递路径避开障碍物,得到一种反映实际通行距离的欧氏距离图像.该算法思路简单直接,不涉及任何复杂数据结构,具有线性时问复杂度.实验表明,该算法计算出的距离图像准确性高,优于ArcGIS基于距离累计的算法,适合于点、线、面3种形态的源和障碍物的欧氏距离变换.  相似文献   

9.
提出了一种基于距离和密度的聚类和孤立点检测算法.该算法根据距离和密度阈值对数据进行聚类,同时发现数据中的孤立点.实验结果表明,该算法能够识别任意形状的聚类,对高维数据有效,能够很好的识别出孤立点.  相似文献   

10.
一种基于距离的聚类和孤立点检测算法   总被引:2,自引:0,他引:2  
提出了一种基于距离的聚类和孤立点检测算法(DBCOD),根据距离阈值对数据点进行聚类,在聚类过程中记录每个数据点的密度,并根据密度阈值确定数据点是否为孤立点.实验结果表明,该算法不仅能够对数据集进行正确的聚类,可以发现任意形状的聚类,算法执行效率优于DBSCAN,具有对噪音数据、数据输入顺序不敏感等优点,同时还能有效地进行孤立点检测.  相似文献   

11.
定义了一种新的基于马氏距离的半监督模糊聚类算法,并推导出它的迭代公式.该算法能够提高聚类算法的运行效率.在人工数据集和真实数据集上的实验结果验证了这种方法的有效性.提取了黄瓜叶片7个色调特征,Fisher降维之后进行半监督聚类分析.对于已标识类别属性的叶片,聚类结果与已知属性的一致率达100%,而对于未标识数据,一致率也达到96%以上.  相似文献   

12.
基于遗传算法的动态文本聚类   总被引:1,自引:0,他引:1  
为了解决动态文本聚类中聚类中心陷于局部极值点的问题,该文提出了基于遗传算法的动态文本聚类方法.采用二进制编码方式对聚类中心进行编码、类内中的点与其类中心的欧氏距离作为适应度函数.通过遗传算子的操作对类中心进行逐步迭代,直至适应度函数收敛,得到使聚类划分效果最好的聚类中心.实验表明该方法可以克服局部极值点的问题,且聚类结果的评价指标Purity(纯度)也比较好.  相似文献   

13.
一种基于流形距离的迭代优化聚类算法   总被引:4,自引:1,他引:3  
针对传统欧氏距离测度描述复杂结构的数据分布会失效的问题,引入能有效反映样本集固有的全局一致性信息的流形距离作为样本间相似度度量测度,并设计了反映类内相似度大、类间相似度小的聚类目标的准则函数,把数据聚类转化成准则函数优化问题,提出了一种迭代优化的聚类算法.通过4个人工数据集的仿真试验结果表明,新方法的参数很少且实现简单,由于实现过程中没有引入随机操作,因此结果比较确定.与标准k均值算法相比,新方法能够自动确定聚类数目,对于样本空间分布复杂的聚类问题具有良好的分类效果.  相似文献   

14.
谱聚类是一种基于图谱划分理论的聚类算法,本质上是将聚类问题转化为图的最优划分问题;量子聚类可以充分挖掘数据样本的内在信息,是一种基于划分的无监督聚类算法.为了充分发挥谱聚类算法和量子聚类算法的优势,本文提出了一种基于流形距离核的谱聚类和量子聚类融合算法(MFD-NJW-QC).首先,计算数据集的流形距离核矩阵,构造相应的拉普拉斯矩阵;其次,根据拉普拉斯矩阵的若干最大特征值对应的特征向量构造新数据集,并使用量子聚类算法对新构造的数据集进行聚类,从而得到原始数据的类标签;最后,基于7个人工数据集和5个UCI数据集验证MFD-NJW-QC算法的聚类性能.结果显示,MFD-NJW-QC算法能够明显提高聚类性能,尤其对于具有流形结构,且类簇大小不平衡、密度分布不均匀的数据集优势更为突出.  相似文献   

15.
一种改进的凝聚层次聚类法   总被引:1,自引:0,他引:1  
以实例说明了选用以欧氏距离或明考斯基距离为距离度量的凝聚层次聚类法进行聚类时会出现的问题,并详细分析了用该算法出现问题的原因.结合模糊聚类思想,给出了一种改进算法,通过实例说明该改进算法的合理性和有效性.  相似文献   

16.
乳腺核磁共振影像( MR)的有效分割一直是医学影像分析领域的研究热点。针对目前人工解读图像信息的不足,提出一种自动化分割乳腺MR图像的方法,该方法结合传统FCM算法和最小距离分类器实现了感兴趣区域中不同位置、灰度值相似的样本点按距离分类。算法首先根据图像的灰度信息利用FCM算法实现聚类,其次自动提取感兴趣区域的聚类信息,并利用最小距离分类器对其按距离分类。实验结果表明,该算法对乳腺核磁共振影像的分割具有较高的准确性,提高了其组织划分的精度,且自动化程度比较高,为后续进行肿瘤区域的自动提取与识别奠定基础。  相似文献   

17.
利用一种新的距离测度将Dave的广义噪声聚类(GNC)扩展成非欧氏距离的广义噪声聚类(NGNC).模糊C-均值聚类(FCM)和广义噪声聚类都是基于欧氏距离的模型,与它们不同之处在于NGNC是基于非欧氏距离的模型,建立在鲁棒统计观点和势函数基础上,这种非欧氏距离比欧氏距离更加鲁棒,因此NGNC算法比GNC算法更加鲁棒.并且,建立在新的距离测度上的NGNC在处理噪声和野值方面比GNC和FCM更好.实验结果表明了NGNC的良好特性.  相似文献   

18.
边缘信息指导下的半模糊聚类图像分割方法   总被引:2,自引:0,他引:2  
提出了一种利用边缘信息的半模糊均值聚类的图像分割算法,它先用边缘检测和区域生长算法对图像进行一次预分割,确定聚类的初始参数,然后在这个基础上对“边缘”部分的点采用模糊聚类、非“边缘”部分使用分明聚类,避免了模糊聚类时初始参数设定的盲目性,减少了迭代时的计算量,提高了迭代收敛速度.除灰度特征外,聚类时还利用了点到类的距离特征,较好地保持了分割图像的连续性.直接观察对比多幅图像的分割实验结果可以明显地发现,该算法较常用的Cksu方法、二维熵阈值分割方法以及FCM方法的分割结果更准确.就Lena图像而言,该算法的收敛速度也比一般的FCM快了将近一倍.  相似文献   

19.
针对中智C-均值聚类算法抗噪能力弱的问题,提出基于隐马尔科夫随机场的半监督中智聚类分割算法.利用隐马尔科夫随机场模型的先验信息描述图像像素邻域关系,将其与隶属度相结合作为监督因子,嵌入现有中智聚类并构造半监督中智聚类目标函数;将欧式空间样本通过非线性变换用核函数映射至高维特征空间,增强图像的抗干扰能力;最后采用最优化方法获得隐马尔科夫随机场的半监督核空间中智聚类分割的迭代表达式.对灰度图像添加高斯和椒盐噪声进行分割测试,以验证算法性能.测试结果表明:所建立的分割算法相比基于隐马尔科夫随机场的模糊C-均值聚类等分割算法的抗噪性能有了显著提高.  相似文献   

20.
一种基于半监督降维的聚类算法   总被引:1,自引:1,他引:0  
半监督聚类通过利用少量有标号样本或成对约束等监督信息来提高聚类性能.在此提出一种新颖的基于半监督降维的聚类算法,首先用半监督降维方法对原始数据进行降维,然后在降维后的空间中进行半监督聚类.由于在降维和聚类两个阶段中都利用了监督信息,从而使得算法的聚类性能得到进一步提升.在UCI标准数据集、yale人脸库以及文本数据集上的实验结果验证了该算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号