首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
针对说话人确认系统中GMM超向量建模计算复杂度高以及易受信道干扰的问题,提出一种新型的基于Bhattacharyya距离聚类的WCCN序列核函数算法.首先计算话者GMM模型之间的Bhattacharyya距离,根据该Bhattacharyya距离对话者模型进行聚类,得到聚类中心模型;紧接着对聚类中心模型的均值向量进行MAP自适应,进而生成超向量序列核函数;最后采用WCCN平滑归一化技术对序列核函数进行信道补偿,抑制噪音和信道畸变对核函数的影响.将该Bhattacharyya聚类WCCN核函数应用到SVM说话人确认系统,仿真实验结果表明该核函数可以有效地提高系统的识别准确率和识别速度.  相似文献   

2.
利用Zangwill收敛性定理, 证明了基于核的模糊c均值聚类算法(KFCM)的收敛性. 结果表明, 当核函数在给定数据集上诱导的距离矩阵满足一定条件时, KFCM算法产生的迭代序列收敛或至少存在一个子序列收敛于KFCM聚类模型目标函数的局部极小值点或鞍点.  相似文献   

3.
通过研究基于距离的孤立点发现算法(Cell-Based),指出其存在的问题,提出了一种基于核映射空间距离的入侵检测算法.该算法通过检测孤立点的方法进行入侵检测,首先将样本通过核函数映射到高维特征空间,重新定义特征空间中的数据点之间的距离.然后经过初始聚类算法确定聚类数目和初始类中心,再通过迭代优化目标函数来实现数据点的再聚类,最终得到聚类中心,超出聚类中心点半径r外的点即为孤立点.试验结果表明,该算法能有效突出样本之间的差异,克服传统基于距离的孤立点发现算法易随参数变化而需调整单元结构的缺点,且具有更准确的检测率和较快的收敛速度.  相似文献   

4.
基于模拟退火的无监督核模糊聚类算法   总被引:1,自引:0,他引:1  
提出一种新的核可能性聚类模型, 该模型以核可能性Xie-Beni聚类有效性指标作为代价函数, 基于可逆跳转马尔可夫链蒙特卡罗(RJMCMC)的模拟退火方法作为优化策略, 聚类个数可以在给定的范围内进行变动, 最优的聚类个数与聚类划分被自动获得. 比普通的基于模拟退火的(核)可能性聚类具有更高的效率, 且避免了普通(核)可能性聚类中易产生重合聚类的缺陷. 人造数据集和真实数据集上的对比实验表明了算法的有效性.  相似文献   

5.
层次聚类算法是运行复杂度较高的聚类算法,基于不相似性测度的层次聚类算法不适合稀疏高维数据.结合核函数特点,提出了一种基于核函数的层次聚类算法.利用该算法,对稀疏高维数据进行了层次聚类对比,实验结果表明,该算法提高了层次聚类的准确率.  相似文献   

6.
一种基于核的模糊聚类算法   总被引:6,自引:2,他引:4  
结合核技术与改进的模糊c均值算法聚类准则提出一 种基于核的模糊聚类算法. 通过引入核函数, 样本点被非线性变换映射到高维特征空间进行聚类, 提高了聚类性能. 同时, 算法改进了模糊c-均值聚类模型中的概率型约束条件, 使其对噪声和野值点具有较好的鲁棒性. 在真实数据和人造数据上与常用聚类算法进行了对比实验, 结果表明该算法具有较低的时间、 空间复杂度与较好的聚类性能.  相似文献   

7.
提出一个基于核聚类算法的高校定位模型.引入核函数,将原始数据由数据空间映射到特征空间中进行聚类.核聚类算法经过了核函数的非线性映射,使原始数据的特征更完整地显现出来,从而使聚类结果更客观、有效,可以解决传统方法主观性强、偏差大的缺陷.将核聚类算法应用于我国16所高校定位的研究,结果表明该方法可行且有效.通过聚类结果的分析,提出高校可分为教学科研生态位协调型、低教学生态位高科研生态位型、高教学生态位低科研生态位型3类,并对不同类型高校提出发展建议.  相似文献   

8.
针对化工生产过程数据分布形式的多样性问题,提出了一种基于疏密部数据划分的软测量多模型建模方法.该方法充分应用了全局核函数和局部核函数的特性,以最近邻聚类法为基础,将输入样本数据分为疏部与多个密部,对疏部采用全局核函数,对密部采用局部核函数,构建加强型支持向量分类机子模型,得到由多模型组成的软测量模型.通过对双酚A生产过程中的仿真研究,表明该模型的泛化能力得到提高.  相似文献   

9.
基于核模糊C均值的异常检测方法   总被引:1,自引:1,他引:0  
探索聚类方法在异常检测中的应用,提出了一种基于核的模糊C均值的异常检测方法.该方法使用核的模糊C均值对网络数据进行聚类,并使用基于簇内距离的判断规则对聚类结果进行标定,从而识别出攻击.使用KDD CUP1999数据集进行实验,结果表明本文表现出了高检测率和低误报率的良好性能.  相似文献   

10.
基于测地线距离的核主元分析在齿轮泵故障识别中应用   总被引:1,自引:1,他引:0  
针对传统的高斯径向基核函数中采用欧氏距离计算方法难以完全反映非线性振动数据样本点与点之间位置关系的问题,提出了改进的核主元分析方法.在高斯径向基核函数中使用测地线距离代替欧氏距离,建立基于样本类内散度和类间距的评价函数,运用遗传算法优化测地线距离中邻近点参数k以及高斯径向基核函数中参数σ.对采集的齿轮泵不同状态的振动数据进行经验模态分解,从分解的各阶本征模态分量和残余分量中提取10个无量纲参数构成原始特征参数集;运用优化后的核函数对原始特征参数集进行核主元分析.实验结果表明,改进的核主元分析方法取得了较好的识别效果.  相似文献   

11.
电力负荷数据中可能包含各种坏数据,严重影响负荷预测精度,因此需要从这些合有噪声的日负荷数据中提取出负荷的特征模式,以便对负荷数据进行清洗.以软聚类思想为指导,通过模糊C均值聚类算法及Kohonen自组织特征映射神经网络的互补结合,提出了日负荷特征模式的智能提取方法,该方法不但具有辨识精度高、收敛速度快的优点,而且具有对数据的动态处理能力,为精确的负荷预测和准确的系统分析做好了数据上的准备,对重庆城区供电局负荷数据的实例分析说明了方法的高效性.  相似文献   

12.
CABOSFV_C是一种针对分类属性高维数据的高效聚类算法,该算法采用集合稀疏差异度进行距离计算,并采用稀疏特征向量实现数据压缩。该算法的聚类效果受集合稀疏差异度上限参数的影响,而该参数的选取没有明确的指导。针对该问题提出基于集合稀疏差异度的启发式分类属性数据层次聚类算法( heuristic hierarchical clustering algorithm of categorical data based on sparse feature dissimilarity,HABOS),该方法从聚结型层次聚类思想的角度出发,在聚类数上限参数的约束下,应用新的内部聚类有效性评价指标( clustering validation index based on sparse feature dissimilarity, CVISFD)进行启发式度量,从而实现对聚类层次的自动选取。 UCI基准数据集的实验结果表明,HABOS有效地提高了聚类准确性和稳定性。  相似文献   

13.
嵌入式实时系统中劣质数据动态检测方法研究   总被引:1,自引:1,他引:0  
在嵌入式实时系统中,数据在采集过程中容易出现丢失现象、在传输过程中容易受到外界攻击变成劣质数据,威胁整个系统的安全。当前劣质数据检测方法通过聚类法实现,不仅通信开销大,而且检测性能低下。为此,提出一种新的嵌入式实时系统中劣质数据动态检测方法,建立嵌入式实时系统。介绍自回归模型的构建方法,通过优质数据的变化规律构建自回归模型。为了使构建的自回归模型的误差尽可能地接近0,面对嵌入式实时系统的动态变化对构建的模型进行自适应调整。通过调整后的模型对嵌入式实时系统中劣质数据进行检测,给出检测过程。实验结果表明,采用所提方法对劣质数据进行动态检测,检测精度和效率较高,通信开销较低,整体性能优异。  相似文献   

14.
为解决负荷预测时因数据量大、数据种类繁多带来的计算速度慢、预测精度低等问题,在MapReduce并行编程框架下,提出基于小批量随机梯度下降法的线性回归模型.首先,为清理智能配电终端产生的重复数据和不良数据,提出利用自适应近邻排序算法清除重复记录的数据,并利用K均值聚类的方法剔除异常数据和记录不完整的数据,然后利用F检验法来检验该数据集能否线性表征负荷,再利用T检验法检验特性向量与负荷间线性关系的显著性,并剔除与负荷线性关系较弱的特性向量.根据以上方法建立短期负荷预测模型,并将其用在甘肃武威某区域配电网短期负荷预测中.结果表明,所提出的短期负荷预测模型的平均绝对百分误差为2.043%,均方根误差为3 112.62.这些预测误差满足负荷预测的要求,极大地提高了负荷计算的速度,缩短了负荷预测时间.  相似文献   

15.
散乱点云去噪算法的研究与实现   总被引:3,自引:0,他引:3  
提出了一种快速去除散乱点云数据表面噪声和离群点的鲁棒滤波算法.应用核密度估计聚类方法,通过Mean-Shift迭代过程将每一个采样点"漂移"到核密度估计函数的局部最大值点,该最大值点确定了点云数据的聚类中心并能准确逼近原始曲面,使点云曲面收敛为一个稳定的三维数字模型.算法中的似然估计函数充分考虑了散乱点的法矢方向,因此不仅可以去除不同幅度的噪点,还可以用简单的阈值条件很容易地检测出离群点的聚类,从而实现了点云数据的高效快速光顺去噪.  相似文献   

16.
针对云数据中心资源利用率较低、能源消耗较高的问题,提出了基于资源需求差异的资源均衡调度策略。在包簇框架模型基础上,利用与资源需求相关的距离度量因子,将资源需求差异大的包通过改进的k-means算法进行聚类;利用资源之间的相关性作为包与簇之间的距离,在资源分配的过程中使包能够集中映射到簇中,从而减少簇的使用个数。实验结果表明,在包簇框架的概念下,基于资源需求差异的改进后的k-means聚类算法能够优化包聚类步骤,资源调度算法能够提高云数据中心各类资源利用率、降低资源分配过程中产生的能耗,具有有效性和可扩展性。  相似文献   

17.
时空聚类(spatial-temporal density based spatial clustering of applications with noise,ST-DBSCAN)算法只能处理固定属性的时空数据,且其人为设定阈值的方法具有较大随机性会导致聚类结果不理想.基于ST-DBSCAN算法存在的不足,提出了一种改进的多属性时空聚类算法.改进后的新算法采用绘制时空对象距离频数柱状图来设定自适应阈值,通过引入Gower相似系数、Dice相似系数与欧几里德距离来构建多属性相似度模型,计算多个事务对象之间属性特征的相似度大小,从而将ST-DBSCAN时空聚类算法扩展到更多属性的时空数据聚类分析中.以北京市计算机行业职位招聘信息数据进行实验仿真,实验结果表明,新提出的阈值设定方法可以有效识别部分低密度簇,提高聚类的准确性和有效性;改进后的算法具有较好的普适性与包容性,能对多属性的时空数据进行很好的聚类分析.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号