首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
大数据时代背景下,随着所获数据数量和维度的不断增加,高维数据的处理成为聚类分析的重点和难点.基于同一类别高维数据通常分布在高维环绕空间的低维子空间这一事实,子空间聚类成为高维数据聚类分析领域的重要方法.稀疏子空间聚类(Sparse Space Clustering,SSC)通过交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)对数据矩阵的稀疏自表达系数进行求解,发现分布于低维子空间并集中的数据的稀疏表示并进行聚类.但是ADMM参数多、收敛速度慢,其效率难以满足对大规模数据库进行聚类分析的要求.针对这一问题提出了基于L_0约束的稀疏子空间聚类方法,该方法使用正交匹配追踪(Orthogonal Matching Pursuit,OMP)算法求解L_0约束的自表达稀疏重建问题,构建数据集中各数据之间的相关性矩阵,最终对相关性矩阵应用谱聚类方法得到聚类结果.根据OMP算法每次迭代之间的耦合关系对其进行优化,进一步降低了计算复杂度,提高了算法效率.在生成数据和Extended Yale B database人脸数据库的实验结果表明,该算法与SSC相比,在显著减少计算时间的基础上,取得了与SSC相当的聚类准确率.  相似文献   

2.
提出一种新的稀疏谱聚类算法——基于PAM算法的HSSPAM聚类(high-dimensional sparse spectral clustering based on partitioning around medoids).该算法先用高相关系数过滤及主成分分析降维方法以有效减小甚至消除维度灾难对高维数据处理的影响,再采用Minkowski距离指数变换函数及稀疏化算法来构建分块对角矩阵以重新解释样本之间的相似度;然后构造新颖的拉普拉斯矩阵以实现进一步压缩数据矩阵,进而结合partitioning around medoids(PAM)算法取代传统谱聚类中的K-means算法对特征向量聚类以提高算法的聚类稳定性;最后引入高维基因数据设计了实验,并以不同的聚类评价指标来衡量该研究算法的聚类质量,实验结果表明,新算法能够更精确、更稳定地对基因数据聚类.  相似文献   

3.
针对全局K-means聚类算法和快速全局K-means聚类算法在选择下一簇的聚类中心点时,需要逐一计算数据集中每个点作为备选聚类中心点时的簇内平方误差函数,而数据集中存在很多不可能作为备选点的噪声点.为剔除噪声点,提出了一种基于高密度数的DGK-means算法,并通过UCI数据库中的4组数据集进行实验测试.验证了在聚类效果稳定的前提下,改进的DGK-means算法比全局K-means算法和快速全局K-means算法,聚类用时更短,聚类效率更高.  相似文献   

4.
为解决H∞滤波器结构参数随时间增长而发散的问题,提出了一种动态灰色聚类自适应的H∞滤波新算法.实时估计出系统噪声方差矩阵和量测噪声方差矩阵,对状态变量进行灰色聚类,并对滤波矩阵和增益矩阵进行实时自适应调整,计算出状态向量的递推估计值.仿真结果表明:H∞滤波新算法与传统H∞滤波算法和基本Kalman滤波算法相比,滤波精度相当,输出曲线光滑,滤波器的结构参数在10 s内稳定且收敛.改进后的新算法避免了计算值的发散,鲁棒性强.  相似文献   

5.
在无约束条件下,人脸表情、姿态、光照以及背景等复杂因素可能导致人脸图像的类内变化大于类间变化.针对如何降低较大的类内变化对人脸验证研究的影响,本文结合加权子空间,提出了一种带先验相似性和先验距离约束的相似度度量学习方法.首先,利用类内人脸对样本,学习带权重的类内协方差矩阵,通过加权子空间的投影,从人脸图像中获得鲁棒性的人脸特征表达;其次,利用样本对的相似性与差异性,建立了带先验相似性和先验距离约束的相似度度量学习模型,优化后的度量矩阵可以有效提高特征向量的类内鲁棒性和类间判别性;最后,利用优化的度量矩阵计算人脸对的相似度.在LFW(Labeled Faces in the Wild)数据集的实验验证了所提模型的有效性,与其它同类相似度度量学习方法相比,优化的度量矩阵更能准确地评估人脸间的相似性,并在受限训练集上取得了91.2%的识别率.  相似文献   

6.
一种基于核的模糊聚类算法   总被引:6,自引:2,他引:4  
结合核技术与改进的模糊c均值算法聚类准则提出一 种基于核的模糊聚类算法. 通过引入核函数, 样本点被非线性变换映射到高维特征空间进行聚类, 提高了聚类性能. 同时, 算法改进了模糊c-均值聚类模型中的概率型约束条件, 使其对噪声和野值点具有较好的鲁棒性. 在真实数据和人造数据上与常用聚类算法进行了对比实验, 结果表明该算法具有较低的时间、 空间复杂度与较好的聚类性能.  相似文献   

7.
提出一种新的TS模型辨识算法.该算法思想:首先采用MCR算法(Mountain C-Regressionmethod)自动确定聚类数目和初始聚类中心,然后采用改进的GK(Gustafon-Kessl)聚类算法得到最优的划分矩阵,再根据最优划分矩阵计算系统前件参数的最优值,最后用自适应粒子群优化算法(Adaptive Parti-cle Swarm Optimization,APSO)对后件参数进行优化.此辨识算法能够用较少的规则数描述给定的未知系统,并且容易实现.仿真实验表明该算法能够实现非线性系统的辨识,并且可获得相对高的精度.  相似文献   

8.
基于传统的Fuzzy等价关系聚类法,由Fuzzy相似矩阵构建Fuzzy等价矩阵,对传递闭包采用Warshall算法求解,并选择不同置信水平下的分类,利用偏差度得到最优聚类.结合北京市朝阳区近3个月新开楼盘的数据,选择可靠性指标,在最佳置信水平的基础上对其进行最优聚类,实验结果与事实吻合.  相似文献   

9.
针对基因表达数据高维、高噪声等特点,提出了一种基于正交约束的负矩阵分解算法;该算法将正交约束引入到β散度矩阵分解的准则函数中进行优化求解,用梯度下降方法得出矩阵分解的乘积迭代规则,并利用分解项来降低特征空间的维度,将得到的向量用于K均值聚类;实验中选择5种肿瘤基因表达数据,实验结果表明:改进的算法分解所得矩阵在聚类效果上明显优于其他的方法.  相似文献   

10.
密度峰值聚类算法(Denisity peaks clustering,DPC)具有聚类速度快、实现简单、参数较少等优点,但该算法的截断距离参数需要人工干预,并且参数的选取对于该算法的结果影响较大。为了解决这一缺陷,该文提出了结合蝙蝠算法改进的密度峰值聚类算法。该算法利用蝙蝠算法较强的寻优能力,寻找合适的截断距离取值,同时对蝙蝠算法的速度更新公式加入了自适应惯性权重来加强全局搜索能力。该算法选择多种数据集进行了实验仿真,并与其他同类算法进行对比。经过对比验证,结合蝙蝠算法改进的密度峰值聚类算法在聚类准确率上要明显优于其他算法。  相似文献   

11.
一种新的密度加权粗糙K-均值聚类算法   总被引:1,自引:0,他引:1  
为了克服粗糙K-均值聚类算法初始聚类中心点随机选取,以及样本密度函数定义所存在的缺陷,基于数据对象所在区域的样本点密集程度,定义了新的样本密度函数,选择相互距离最远的K个高密度样本点作为初始聚类中心,克服了现有粗糙K-均值聚类算法的初始中心随机选取的缺点,从而使得聚类结果更接近于全局最优解。同时在类均值计算中,对每个样本根据定义的密度赋以不同的权重,得到不受噪音点影响的更合理的质心。利用UC I机器学习数据库的6组数据集,以及随机生成的带有噪音点的人工模拟数据集进行测试,证明本文算法具有更好的聚类效果,而且对噪音数据有很强的抗干扰性能。  相似文献   

12.
为预防公共场所的行人安全事故,优化和改善人群安全管理,基于情景实验的数据,利用密度峰值算法和具有噪声的密度聚类算法,从不同时刻分布变化的角度,分别选取单走廊双向行人流、90°和120°交叉路口的行人流场景研究行人流群集区域的分布状态,并比较了两种算法的聚类效果和参数差异,得出场景实验数据中行人流群集区域的分布规律和变化特征。研究发现聚类簇在3个场景的行人移动过程中均是动态变化的,不会处在某个稳定的聚类状态。使用该方法识别密集人群的潜在群集区域及位置,可以观察场景内安全隐患区域,提前在这些区域放置引导疏散设施,同时做好全路段防护,提高行人群集疏散的效率及安全性。  相似文献   

13.
聚类算法是数据挖掘领域中一个非常重要的研究方向.至今为止人们已经提出了许多适用于大规模的、高维的数据库的聚类算法.基于密度的聚类算法是其中一个比较典型的研究方向,文中以DBSCAN为基础,提出一种基于密度的网格动态聚类算法.新算法将网格的原理运用到基于密度的聚类算法中,并采用了动态的参数法,能自动根据数据的分布情况进行必要的参数更改,有效减少DBSCAN对初始参数的敏感度,从而提高了聚类的效率和效果,降低了算法I/O的开销.算法不仅能挖掘出各种形状的聚类,并能准确的挖掘出数据集中突出的聚类.  相似文献   

14.
在改进模糊c均值聚类(MFCM)算法基础上提出模糊可能性c均值聚类(FPCM)算法的图像分割方法,并将FPCM算法应用在彩色图像分割过程中.FPCM算法是FCM聚类算法和MFCM算法的扩羼衍生.MFCM算法是通过调整FCM算法的测量距离来减少标签像素受到其他图像像素的影响和在切分中抑制噪声效果来进行约束,从而使得成员变量没有最大约束值.FPCM算法是在MFCM算法基础上进行模糊化,加入了可能性和隶属度两个度量标准.通过彩色图像实验充分表明了FPCM算法在图像分割中的实际效果.  相似文献   

15.
基于OpenCV的口唇检测研究   总被引:1,自引:1,他引:0  
唇读技术在提高噪音环境中语音识别系统的识别率和帮助有听力障碍的人更好的理解语言方面起到了一定的辅助作用。由于说话过程中口型变化较大,直接提取口型区域较困难;而在发音过程中鼻子形状不会发生较大变化,且OpenCV自带的人脸检测器可以很好的检测出人脸。提出了一种利用嘴唇与人脸和鼻子的相对位置关系进行检测嘴唇区域的方法。实验证明,该方法可以比较快速,精确地提取出嘴唇区域,从而利于精确的进行口唇分割。  相似文献   

16.
为实现双人场景下人体行为的识别,利用调频连续波(frequency modulated continuous wave, FMCW)雷达提出一种基于空间聚类的双人行为识别方法.该方法采用基于密度的DBSCAN(density-based spatial clustering of applications with noise)聚类算法将FMCW雷达采集到的坐标数据聚类成不同的聚类群,使得每一个聚类群对应于单一人体的行为,再对其进行数据处理、特征提取后分别采用机器学习方法分类,实现双人场景下人体行为的识别.文中分析行为特征量、动作关键点以及分类器对识别准确率的影响.实验结果表明,在两人场景中该方法对跌倒、坐下和行走的检测准确率分别可以达到100%、 93.8%和87.3%.  相似文献   

17.
为解决实时分析处理的海洋 Argo 浮标剖面观测数据特有的数据密度较高、快速响应且需要识别任意形状簇等问题, 提出了一种可通过单次扫描数据集进行有效处理的低复杂度聚类算法 DBIRCH( Density-BasedBalanced Iterative Reducing and Clustering Using Hierarchies)。 该算法通过使用新引入的参数密度阈值修正因子,动态的更新限制 CF(Clustering Feature)树生长的约束系数子空间阈值, 同时结合密度关联思想在不同邻域内多次建立 CF 树且合并, 最终以核心 CF 树子节点为聚类结果输出, 避免了 BIRCH(Balanced Iterative Reducing and Clustering Using Hierarchies)算法对参数的过度依赖, 同时因能处理任意形状簇从而提升了数据处理的整体鲁棒性, 提高了处理 Argo 剖面监测数据的时效性和算法的整体吞吐速度。 为测试算法的综合性能, 使用真实 Argo浮标剖面实时监测数据集, 并根据不同的参数对算法做出多组对比实验, 同时使用不同评价指标对算法从运行时间和聚类准确率上进行综合评估, 从全局角度分析该算法在 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)、 BIRCH 及 DBIRCH 3 种不同算法中综合聚类性能最优。 实验结果表明, 在3 种算法中,BIRCH 算法运算速度最快, 但准确率最低; DBSCAN 算法聚类性能高于 BIRCH 算法, 但运算速度最慢; 改进的DBIRCH 算法运算效率略低于 BIRCH 算法, 但聚类准确率最高。  相似文献   

18.
研究了基于可能性熵理论的聚类问题.首先定义并讨论了可能性熵,继而将可能性熵引入聚类分析,提出了可能性熵聚类算法.它考虑到熵聚类的全局和局部效应,具有清晰的物理意义和数学特征.该算法还能在聚类过程中自动地确定分辨率参数,克服了对于噪声和外围点的敏感性.仿真实验证明,即使各类大小不一,数据集被强噪声所污染时,该算法仍能有效地估计各类中心.  相似文献   

19.
考虑到实验数据的大规模及样本数据形状的复杂性等特点,提出一种基于分级聚类与DBSCAN聚类相结合的HL-DBSCAN聚类算法,避免了DBSCAN的聚类算法较大的时间复杂度,适用性更广,更能体现一个聚簇的规律,提高分类精度.通过实验与结果分析,取得较好的聚类结果,证明了该算法在文本聚类处理中的可行性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号