首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
传统流形学习算法虽然是一种常用的有效降维方法,但由于其自身计算结构的限制,往往存在数据分析不足和计算时间较长等问题.为此提出一种基于谱聚类的流形学习算法(spectralclustering locally linear embedding,SCLLE),并对其机理以及优点给予了实例证明.在UCI和NCBI数据集上的实验结果表明,该算法具有较好的识别效果和计算性能.  相似文献   

2.
一种基于流形距离的迭代优化聚类算法   总被引:3,自引:1,他引:3  
针对传统欧氏距离测度描述复杂结构的数据分布会失效的问题,引入能有效反映样本集固有的全局一致性信息的流形距离作为样本间相似度度量测度,并设计了反映类内相似度大、类间相似度小的聚类目标的准则函数,把数据聚类转化成准则函数优化问题,提出了一种迭代优化的聚类算法.通过4个人工数据集的仿真试验结果表明,新方法的参数很少且实现简单,由于实现过程中没有引入随机操作,因此结果比较确定.与标准k均值算法相比,新方法能够自动确定聚类数目,对于样本空间分布复杂的聚类问题具有良好的分类效果.  相似文献   

3.
在介绍了基于信息熵的蚁群聚类算法以及流形学习的方法的基础上,将基于动态切空间排列的流形学习方法与该蚁群聚类算法相结合,给出了一种聚类算法的新思路,并在城市规划布局问题中做了仿真实验,提高了算法的收敛速度。  相似文献   

4.
谱聚类是一种基于图谱划分理论的聚类算法,本质上是将聚类问题转化为图的最优划分问题;量子聚类可以充分挖掘数据样本的内在信息,是一种基于划分的无监督聚类算法.为了充分发挥谱聚类算法和量子聚类算法的优势,本文提出了一种基于流形距离核的谱聚类和量子聚类融合算法(MFD-NJW-QC).首先,计算数据集的流形距离核矩阵,构造相应的拉普拉斯矩阵;其次,根据拉普拉斯矩阵的若干最大特征值对应的特征向量构造新数据集,并使用量子聚类算法对新构造的数据集进行聚类,从而得到原始数据的类标签;最后,基于7个人工数据集和5个UCI数据集验证MFD-NJW-QC算法的聚类性能.结果显示,MFD-NJW-QC算法能够明显提高聚类性能,尤其对于具有流形结构,且类簇大小不平衡、密度分布不均匀的数据集优势更为突出.  相似文献   

5.
混合蛙跳算法(SFLA)是一种基于子群——种群进化模式的群智能优化算法,通过自身特有的分组算子实现不同解的合理分布,能够有效跳出局部最优;局部位置更新算子只对最差解进行更新,加快了算法的收敛速度。针对传统算法在解决聚类问题时存在聚类精度低和算法收敛速度较慢等缺点,本文提出了运用混合蛙跳算法来解决聚类问题,通过采用基于图像二维空间像素特征提取的方法构造青蛙个体解,设计青蛙进化的目标函数和青蛙位置更新策略,并通过数字,图形等验证了该算法解决聚类问题的有效性.  相似文献   

6.
虽然聚类与分类算法的研究应用已很普遍,但在入侵检测领域把二者结合起来进行研究分析的情况并不普遍,因此,提出了一个分层的聚类与分类算法混合模型,并通过K—Means聚类算法、改进的差分进化算法与最近相邻分类算法为例对入侵数据集样本进行聚类与分类,最后得出有效的实验结果。  相似文献   

7.
考虑数据点之间局部统计性质的差异,结合K平均算法提出一种基于统计流形的聚类算法.通过计算数据点邻域的均值和协方差,将原始数据点云映射到正态分布族流形中,成为参数点云.在正态分布族流形上构造不同的度量结构,分别应用K平均方法,对参数点云进行聚类,从而将对应的原始数据分类.此算法可以应用到点云去噪.采用基于不同差异函数的算法,对含高密度噪声的点云去噪,并给出模拟仿真结果.仿真结果表明,采用KL散度作为差异函数的算法有较好的去噪效果,体现出该算法在去噪应用中的潜力.   相似文献   

8.
在使用K-Means进行文本聚类的研究中,针对K-Means算法缺点,提出了利用DBSACN算法确定参数K的方法,将基于密度的聚类算法应用于特征选取上,使得K值计算有了一定的确定性,从而提高了聚类质量。这种将多种算法混合运用的方法,为文本聚类算法的设计提供一个新的方向。  相似文献   

9.
基于K -均值聚类的混合聚类算法   总被引:1,自引:0,他引:1  
K-均值聚类算法是聚类算法中比较典型的算法之一,在其各类改进算法中都受到了离群点、初质心、类个数等因素的干扰。本文利用相似密度提出一种新的聚类初始质心选取和离群点判别方法,对K-均值聚类算法进行了改进。通过实验证明改进算法提高了聚类的有效性和稳定性。  相似文献   

10.
聚类算法是多元统计的一个重要分支,在理论和实际生活中都有重要的意义。本文对聚类算法的发展历程以及近年来发展的一些聚类算法进行研究。  相似文献   

11.
密度峰值算法依赖于欧式距离实现局部密度的选择,该算法在处理高维数据、存在密度不均匀的类簇的数据集上效果不是很理想.针对以上问题,提出一种融合流形距离与标签传播的改进密度峰值聚类算法(improved density peak clustering combining manifold distance and labe...  相似文献   

12.
周忠华 《科技信息》2009,(13):150-151
本文分析了移动自组网的现有分簇算法,并针对现有分簇算法的不足对NTDR进行了改进.提出了基于按需加权的NTDR(DWNTDR)。  相似文献   

13.
网页聚类技术是快速定位搜索引擎返回结果中用户最需要资料的方法。基于后缀树聚类算法是利用网页集中共享的短语来对网页集进行聚类。本文研究怎样充分利用后缀中的共享短语之间的关系提高后缀树性能的方法。  相似文献   

14.
滚珠丝杠副的正常运行对于保持数控机床稳定性和加工性能具有重要意义。因此,滚珠丝杠副的性能衰退过程评估在健康管理工作中显得尤为必要。考虑到滚珠丝杠副运动的往复性,振动信号的非平稳性和非线性,常规特征提取方法难以直接提取其准确特征。研究了利用数据分段,模糊熵、典型时域特征流形距离进行滚珠丝杠副健康评估的方法。首先,针对原始振动信号进行数据分段处理,区分出滚珠丝杠副滑块正反向运行数据。其次,对分段后同一方向数据提取原始信号的模糊熵和典型时域特征进行多特征融合,构建特征空间。然后,将提取特征归一化计算正常数据与样本数据的流形距离。最后,将流形距离转换成置信值,从而得到滚珠丝杠副的健康程度。试验结果表明,所采用评估方法能够有效评估滚珠丝杠副的性能,为其视情维修提供依据。  相似文献   

15.
将中文语块分析看做词在句子内部聚类并标记语块类别的过程, 建立了中文语块分析的聚类模型。首先构建词的语法功能空间, 使用ISOMAP方法重构词空间的低维流形嵌入, 进而考察词在低维空间中的分布情况。在使用层次聚类方法分析语块时, 使用流形上的距离替代传统的欧式距离, 在算法复杂度可以接受的范围内, 提高了语块分析效果。  相似文献   

16.
K-means聚类算法是近年来数据挖掘学科的一个研究热点和重点,该算法是基于划分的聚类分析算法.目前这种算法在聚类分析中得到了广泛应用。本文将介绍K-means聚类算法的主要思想,及其优缺点。针对该算法经常陷入局部最优,以及对孤立点敏感等缺点,提出了一种基于模拟退火算法的方法对其进行优化,可以有效地防止该算法陷入局部最优的情况。  相似文献   

17.
This paper puts forward a method of parameterized design,i.e.the geometric parameters of hydraulic elements are inputted into specially designed drawing interface program,so the manifold block drawing of hydraulic system can be automatically created by the computer and AUTOCAD.Eventually not only the mistakes can be avoided but the efficiency is greatly increased and the time of designing is noticeably shortened as well.  相似文献   

18.
本文在Seller算法的基础上提出了一个新的求进化距离的改进算法。该法通过计算来求出一条最短路径,去掉了指针矩阵。并且在求最短路径时采用了分支与定界、对角线方向扩展、相邻对角线传递等技术。从而不仅使改进算法的空间耗费由Seller算法的平方级(O(m×n))降为线性级(O(m+n)),并且其时间耗费仍能保持Fickett算法的结果。该算法已在IBM-PC/AT上实现。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号