首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 203 毫秒
1.
为了解决局部线性嵌入(locally linear embedding, LLE)流形学习算法无法自适应确定重构区间和不能进行增量学习等问题,提出了一种自适应聚类增量LLE(clustering adaptively incremental LLE,C-LLE)目标识别算法。该算法通过建立高维非线性样本集的局部线性结构聚类模型,对聚类后的类内样本采用线性重构,解决了LLE算法样本重构邻域无法自适应确定的问题;通过构建降维矩阵,解决了LLE算法无法单独对增量进行降维和无法利用增量对目标进行识别的问题。实验表明,本文算法能够准确提取高维样本集的低维流形结构,具有较小的增量降维误差和良好的目标识别性能。  相似文献   

2.
局部线性嵌入算法(locally linear embedding,LLE)是一种非线性降维方法.当数据量较大时,算法计算效率较低,算法运行所占用的内存空间较大.为了提高LLE算法的计算效率和减小算法运行时占用的内存空间,给出了基于RSOM(Recursive SOM)树聚类的LLE算法,通过RSOM树对数据集进行聚类,在保证输入样本依概率分布的同时显著降低算法复杂度,提高了映射效果.仿真实验表明,基于RSOM树聚类的LLE算法相对于原始的LLE算法,其算法效率有了显著提高,明显降低了算法运行所占用的内存空间,同时很好地学习了高维数据的流形结构.  相似文献   

3.
针对一种可快速搜索和寻找到聚类密度峰值点聚类算法的缺陷,利用线性回归与残差分析的方法进行改进,可自动、快速地确定聚类中心且优化样本点密度值。算法利用样本点的近邻信息重新度量点的密度值,提高聚类中心点位置稳定性;利用一元线性回归与残差分析,快速、自动地选出聚类中心点,去除了人为选择的主观性。通过理论分析以及在人工数据集和真实数据集的对比实验表明,提出的基于线性回归分析的快速搜索聚类中心算法能够克服原有算法的缺陷,并且在聚类效果和计算时间上优于原有算法、基于密度的带有噪声的空间聚类算法(density based spatial clustering of applications with noise, DBSCAN)以及K-means算法。  相似文献   

4.
基于改进的模糊C-均值的分级递减聚类算法   总被引:2,自引:0,他引:2  
提出了基于改进的模糊C-均值的分级递减聚类算法,利用改进的模糊C-均值聚类算法寻找类中心,再自适应确定该类中心的隶属度阈值,将聚类进行分级处理,实现未知类数数据集的聚类。实验结果表明,本算法对未知类数、具有高斯分布的数据集具有聚类效果好、收敛快的特点,且对于类数较多的数据集,本算法也是一种快速聚类算法。  相似文献   

5.
大数据处理是物联网研究和应用上不可回避的难题之一,针对常用聚类方法在大数据处理上的不足,设计了一种划分聚类新方法。该方法采用了大数据集的抽样技术,对多次抽取的规模足够大的样本进行聚类以确定自然簇质心的初始位置,在此基础上采用抽样后剩余数据样本对质心的初始位置进行更新,以便校正偏离理想位置的初始质心。该划分聚类算法具有线性空间复杂度和时间复杂度。实验结果表明所提的新聚类算法不仅能得到比常用聚类算法更理想的结果,而且运行速度快,适合处理大规模数据的聚类任务。  相似文献   

6.
一种FCM聚类算法的改进与优化   总被引:7,自引:0,他引:7  
针对一种FCM聚类算法的一些不足 ,提出了具体的改进与提高的方法 ,并引入模糊决策理论 ,进行算法参数m的优化选择。改进后的算法 ,一方面有效地弥补了原算法中存在的不足 ,更好地解决了聚类数目选择等初值问题 ;另一方面 ,通过对参数m的优化选择 ,取得了较理想的聚类效果。最后给出了几种聚类算法对某数据样本集的聚类对比结果。  相似文献   

7.
王勇  吴翊 《系统仿真学报》2008,20(22):6066-6069
等距特征映射(Isomap)是一种新颖、高效的非线性降维技术,它的一个突出优点是只有两个参数需要设定,即邻域参数和嵌入维数。我们提出了一种新的估计Isomap的最优嵌入维数的算法,该算法使用执行Isomap过程本身所产生的数据来估计流形的最优嵌入维数,同时能确定邻域参数的最优值。通过与常用的残差估计方法的实例对比,说明这种算法对人造数据集和真实数据集都很有效,而且能更加合理、更加客观地估计出流形的最优嵌入维数。  相似文献   

8.
高维数据聚类是数据挖掘领域的重要研究课题,大规模高维数据聚类研究非常具有挑战性.针对高效的CABOSFV高维数据聚类算法,采用并行计算模式提高其大规模数据的处理能力,提出基于稀疏指数排序的高维数据并行聚类算法P-CABOSFV.该算法根据高维数据稀疏指数排序进行分割点选择实现数据划分,将数据分配到多个计算节点同时处理聚类任务,再基于集合稀疏特征差异度聚类结果合并策略将各计算节点的聚类结果合并得到最终聚类结果.UCI数据集和计算机合成数据集实验表明:高维数据并行聚类算法P-CABOSFV聚类质量良好,具有很强的数据规模和数据维度可扩展性,是有效可行的.  相似文献   

9.
可追溯食品消费偏好等实证调查中具有大量的分类属性的数据,而常用的-means聚类方法主要适用于连续的数值型数据,难以精确分析可追溯食品消费者类别。为此,本文引入-modes聚类方法,通过改进聚类精度,改善聚类流程,改进了现有的-modes算法,以更好地应用于分类属性数据的聚类分析。以分类正确率、类精度、召回率、平均迭代次数为评价检验的具体指标,相关检验表明,与经典-modes聚类算法等相比较,本文改进后的-modes聚类算法在标准数据集上实验结果良好。在此基础上,以可追溯猪肉为案例,通过菜单选择实验法收集消费者对可追溯猪肉信息属性偏好的数据,建立仿真分析流程,运用改进后的-modes算法进行聚类分析,研究了消费者对可追溯猪肉属性的群体性偏好。仿真结果显示,消费者对可追溯猪肉信息属性的偏好具有明显的层次性、差异性,可基于消费偏好将消费者划分为4个类别。  相似文献   

10.
多邻域改进粒子群算法   总被引:5,自引:1,他引:4  
为了改进标准粒子群算法的性能,提出了多邻域改进粒子群算法。算法提出了一种较为简单的多邻域拓扑方案,对速度惯性权重的更新策略进行了改进,引入了速度和搜索区间限制算法。经过对经典测试函数的计算测试,算法表现出良好的复杂问题求解能力。最后,针对多目标优化问题,给出了多目标应用在粒子群算法中的处理方法,并对经典的5维优化和Golinski 减速器设计问题进行了求解,通过数据比对,证明了算法性能远优于现有的一些算法。  相似文献   

11.
传统聚类算法在解决含有不确定性的聚类问题时具有很大的局限性,为了更好地解决聚类问题中的不确定性,论文基于区间二型模糊集理论,提出了基于二型模糊等价关系的聚类分析算法.论文首先将语言变量信息完整地转化为区间二型模糊集,接着把语言变量和区间二型模糊集的优势相结合,通过区间二型模糊集的Jaccard相似度,提出了基于区间二型模糊语言变量的模糊等价关系聚类分析新方法,并设计了具体的算法流程.新聚类算法相对于传统的模糊等价关系的聚类算法,具有更好地处理不确定性问题的能力,避免了聚类计算过程中的信息丢失.同时新聚类算法可以灵活给出随聚类相似性参数变化的动态聚类结果.论文最后以电商平台的手机品牌聚类为例,验证了新算法的可行性和合理性.  相似文献   

12.
特征加权是聚类算法中的常用方法,决定权值对产生一个有效划分非常关键。基于模糊集、粗糙集和阴影集的粒计算框架,本文提出计算不同簇特征权重的聚类新方法,特征权值随着每次迭代自动地计算。每个簇采用不同的特征权重可以更有效地实现聚类目标,并使用聚类有效性指标包括戴维斯-Bouldin指标(Davies-Bouldin,DB)、邓恩指标(Dunn, Dunn)和Xie-Beni指标(Xie-Beni, XB)分析基于划分的聚类有效性。真实数据集上的实验表明这些算法总是收敛的,而且对交叠的簇划分更有效,同时在噪声和异常数据存在时具有鲁棒性。  相似文献   

13.
1.INTRODUCTION Fuzzyclusteringisanunsupervisedwayofdatagrouping andusefulinpatternrecognition,informationretrieval,imageprocessing,faultdetection[1,2].Itgroupsdatainto finiteclustersbyusingsomekindsofmeasuressuchasthe linearandnon lineardistance,theentropymeasure,or inclusiondegreeinfuzzyenvironments.Intermsofthe modelsandmeasuresbetweenobjects,differentalgo rithmspartitiondifferentdatasetsandproduceclusters withdifferentshapesandhavedistinctdifferenceintime andspaceefficiency.Currentclus…  相似文献   

14.
由于传统主动学习方法的计算量随着问题规模的增大呈指数增长, 因此很难应用于大规模多类数据分类任务中。为解决该问题, 设计了一种基于子抽样的主动学习(subsampling-based active learning, SBAL)算法。该算法将无监督聚类算法与传统主动学习方法整合, 在二者之间增加了子抽样操作, 该操作能够显著降低算法的时间复杂度, 在保证实验准确率的基础上减少实验耗时, 从而更加高效地处理大规模数据集的分类问题。实验结果显示, 采用SBAL算法的实验性能优于传统主动学习算法, 证明了所提算法可以突破传统主动学习方法不能处理大规模数据集多类别分类问题的局限性。  相似文献   

15.
从"独立性差"角度出发,提出了ISE准则下的"独立性差"估计新方法(difference of independence estimation,DOIE).从数学模型上证明该算法与单类SVM等价且可用于解决分类问题.当数据集规模较大时,该算法的优势在于可用较少样本点表示两数据集中样本点间的关系,在保证精度的前提下,提高运算速度.该算法还可应用于两数据集独立性判断、检测流数据分布改变点的位置.若退化为单类数据集,可应用于概率密度估计.Benchmark和UCI数据集上的实验表明,该算法具有较好的性能.  相似文献   

16.
一种采用LLE降维和贝叶斯分类的多类标学习算法   总被引:2,自引:0,他引:2  
多类标数据中的样本可能属于一个或多个类标,因此其分类问题较单类标分类更为复杂。提出一种新的多类标学习算法,首先针对多类标数据的特征属性维数高的特点,采用LLE算法对多类标数据的特征属性进行降维,提取能较完整描述数据的一组低维特征属性集;然后将多类标样本集按所属的类标进行划分,并采用贝叶斯分类模型来学习各组样本集的分类特性;根据各个分类模型的判定类标,综合得到多类标样本的最终类标集。将该算法分别应用到自然场景图像和基因数据的多类标分类学习中,实验结果表明,该算法针对不同的多类标数据集均能取得很好的分类效果,且相比于其他多类标算法有更高的性能。  相似文献   

17.
Most of the earlier work on clustering mainly focused on numeric data whose inherent geometric properties can be exploited to naturally define distance functions between data points. However, data mining applications frequently involve many datasets that also consists of mixed numeric and categorical attributes. In this paper we present a clustering algorithm which is based on the k-means algorithm. The algorithm clusters objects with numeric and categorical attributes in a way similar to k-means. The object similarity measure is derived from both numeric and categorical attributes. When applied to numeric data, the algorithm is identical to the k-means. The main result of this paper is to provide a method to update the “cluster centers“ of clustering objects described by mixed numeric and categorical attributes in the clustering process to minimise the clustering cost function. The clustering performance of the algorithm is demonstrated with the two well known data sets, namely credit approval and abalone databases.  相似文献   

18.
蔡荣太  王延杰 《系统仿真学报》2008,20(22):6029-6032,6038
对稀疏混合数据进行分析,发现该类数据具有方向性聚集分布的特点。首先证明了可以采用方向性聚类方法对稀疏混合数据进行处理分离出原数据。即用方向性聚类算法对稀疏混合数据进行聚类分析可以估计出混和矩阵。然后证明采用方向性聚类算法分离出来的数据和原数据之间具有确定的尺度和次序变化关系。最后针对多通道混合数据的盲分离提出了基于中心矢量聚类的稀疏混合数据分离算法SMDDCVC(sparse mixing data decomposition based on center vector clustering),并将该算法用于稀疏混合图像的盲分离。实验结果表明基于SMDDCVC算法的稀疏混合数据盲分离算法是有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号