首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
量化子空间分布隐马尔可夫模型的间接训练   总被引:3,自引:2,他引:1  
研究了量化子空间分布隐马尔可夫模型(quantized subspace distribution hidden markov model,QSDHMM)间接训练所涉及的三个关键的问题:连续分布隐马尔可夫模型(continuous distribution hidden markov model,CDHMM)的训练、特征子空间的划分和子空间高斯分布的量化方案。提出了相关特征子空间的定义及实现算法。在仿真实验中,采用基于分类学的:Bhattacharyya距离测度的K均值高斯聚类算法对子空间高斯分布进行量化,用最相关子空间的概念划分特征子空间,并将这两者结合使用,提高了系统的识别精度和速度。  相似文献   

2.
量化子空间分布隐马尔可夫模型   总被引:4,自引:0,他引:4  
提出了量化子空间分布隐马尔可夫模型(QSDHMM)。该模型可由连续分布隐马尔可夫模型(CDHMM)导出,方法是先将CDHMM的高斯分布投影到K个子空间,然后将每个子空间高斯分布聚类成一个数目较小的“高斯分布原型”。用这些“高斯分布原型”可以表示出声学模型的状态分布,理论分析和仿真实验表明,对于大词表连续语音识别系统,与CDHMM相比较,QSDHMM可以压缩模型参数18倍,从而节省系统存储空间,但精度无明显降低。  相似文献   

3.
本文讨论了基于非均匀矢量量化、隐马尔可夫模型(HMM)的孤立数字语音识别系统。在现有的连续密度隐马尔可夫模型多说话人孤立数字识别系统中,通常采用 LBG 算法建立矢量码本,并采用全搜索识别算法,这样的结果限制了识别精度和识别速度。本文提出了一种新的系统算法,即用非均匀矢量量化(Non-Uniform Vector Quantization——NUVQ)取代原矢量量化部份,实验结果证明,本系统在识别速度和识别精度上都有了较大的改善。  相似文献   

4.
为了解决传统K均值算法在处理大规模数据时的局限性,在近似K均值算法(AKM)基础之上,利用对聚类中心进行分类的思想,提出了快速近似K均值算法(FAKM).该算法舍去了在AKM聚类结果中只获得少数样本的聚类中心,并充分利用类内样本密集稳定的聚类中心,使得迭代过程中待聚类样本数和类别数逐步减少,达到了提高算法速度及精简聚类结果的目的.将FAKM算法运用于实际的图像检索系统中,实验结果表明,系统在检索准确率、检索时间和聚类时间方面都得到了很好的改善.  相似文献   

5.
在分析自组织特征映射(SOFM)算法的基础上,把进化策略引入到矢量量化设计中,在将SOFM算法作为基本聚类算法的前提下,基于等误差原则,利用最大最小原则改变各区域聚类点,使各子区域的误差趋于相等。使用进化策略在子区域误差大的聚类点附近产生新的聚类点,从而调整各个区域的子误差,进一步改善总期望误差。实验证明该方法可克服基本聚类算法落入局部最化的局限。在对Lena图像进行量化的过程中,改善了码书矢量,提高了码书矢量,提高了量化后图像的质量。  相似文献   

6.
通过将粗糙集和模糊聚类算法相结合, 利用粗糙集中上近似集和下近似集的概念改进模糊聚类算法, 解决了模糊聚类边界不确定的问题, 得到了上近似集和下近似集的聚类结果, 从而实现更好的聚类, 改进算法可以处理边界问题和复杂数据问题. 将改进的粗糙集模糊聚类算法用于研究环糊精聚类, 并将聚类结果与K均值聚类分析算法、 模糊C均值聚类算法相比, 实验结果表明, 改进算法有较好的聚类效果.  相似文献   

7.
K均值算法利用K个聚类的均值作为聚类中心,通过对比样本到各聚类中心的距离,将样本划分到距离最近的聚类中,从而实现样本的聚类.分析了K均值算法的基本原理和实现步骤,并将其应用于数据聚类和图像分割,取得了较好的聚类效果.最后,针对K均值算法的不足之处,提出了改进措施,提高了K均值算法的聚类性能.  相似文献   

8.
提出了一种针对码书优化的图像矢量量化算法。首先设定矢量距离的初始门限值,基于空间划分对训练矢量聚类,找到矢量个数小于平均胞腔矢量数的胞腔;提取其聚类矢量后删除该胞腔,然后缩小距离门限值再次聚类提取,依次循环直到聚类矢量个数达到要求。将提取的聚类矢量作为初始码书,进行LBG算法码书设计,有效地改善了传统LBG算法依赖于初始码书而容易陷入局部最优的缺点,采用改进算法生成的码书更接近全局最优,加快了收敛速度。仿真结果证明了该方法的有效性。  相似文献   

9.
为了提高数据挖掘的聚类准确度,提出了一种基于菌群优化的K均值(K-means)聚类算法.采用K均值算法建立数据聚类模型.根据聚类类别数设定多个聚类中心坐标.设定所属类别距离阈值,然后计算待聚类点和所有中心点距离来划分该聚类点的类别.根据参与聚类各节点和各自中心点的距离值建立适应度函数.引入菌群优化算法对K均值聚类过程进...  相似文献   

10.
讨论了一种模糊聚类神经网络模型,给出了将该模型用于图象矢量量化码书设计的学习算法。实验结果表明,模糊聚类神经网络可以为图象矢量量化压缩编码提供一种新的码书设计方法。  相似文献   

11.
为解决企业客户价值体现问题, 提出一种TFA客户细分改进模型, 以客户发展空间T、 购买频次F和平均购买额A为指标, 充分体现客户的价值和发展空间. 首先, 引入局部密度值ρ和信息熵H, 改进K-means聚类算法, 以优化传统K-means聚类方法初始聚类中心的选取问题;其次, 通过搭建机器学习框架, 对选取人工数据集及真实数据集进行聚类实验, 验证模型的有效性. 实验结果表明, 该模型能有效分类客户, 充分反映客户价值及其发展空间, 并通过改进聚类算法提升了算法效率.  相似文献   

12.
针对传统的RBF网络求取隐层基函数中心的K-均值聚类算法的缺点,利用文化算法的全局搜索性能,将文化算法用于语音识别系统的RBF网络的训练过程中,基于实验数据,指出该方法的识别结果较k-均值聚类算法有了明显的改善。  相似文献   

13.
研究了K均值算法中初始聚类中心的选择对算法本身聚类精度及效率的影响,并提出了改进的算法(LK算法,Leader+K-means).LK算法中的初始聚类中心选择不是随机的,而是利用Leader算法得到若干个初始类中心,然后选择包含数据项最多的k个类中心,作为K均值算法的初始类中心.实验结果表明,LK算法在聚类结果的稳定性和正确率方面都是有效可行的.  相似文献   

14.
针对传统K-均值方法不能有效处理动态变化的数据聚类的问题,本文提出了一种改进的数据流聚类技术——流式K-均值聚类(Streaming K-means Clustering,SKC).该方法首先对数据流中已经产生的初始数据块进行K-均值聚类,当数据流的新数据块到来时,通过衡量已经得到的聚类结果与新进入样本块的距离,对样本进行初步简单归类,并计算聚类结果的性能,若聚类结果性能在可接受范围内,则该数据块聚类结束,否则采用K-均值方法对新类进行深层次聚类.采用SKC的流式数据聚类方法处理数据流的聚类问题,对于整个数据流中的多数数据块都进行简单归类,只有少数数据块进行K-均值聚类,有效提高了数据流聚类的效率.实验结果表明,流式K-均值聚类方法能够有效处理数据流的聚类问题.  相似文献   

15.
针对径向基函数(RBF)神经网络的结构优化问题,提出了一种基于参数优化的RBF神经网络优化算法.首先,改进K-means++算法,使得聚类算法更精确,为RBF神经网络的隐含层节点找到一个合适的初始中心;然后,考虑数据分布和缩放因子选择的影响,采用方差度量法计算隐含层神经元基函数的宽度;最后,修正网络参数,提高网络的非线性逼近能力.实验结果表明,本文提出的基于参数优化的RBF神经网络具有良好的逼近效果和泛化能力.  相似文献   

16.
一种改进的RBF神经网络混合学习算法   总被引:3,自引:0,他引:3  
提出一种基于粒子群优化算法、K-means算法及减聚类算法的径向基函数(RBF)神经网络混合学习算法.该算法使用减聚类方法确定隐层节点数,具有自适应确定隐层节点的能力,避免了调整隐层节点的人为干预.通过K-means算法形成粒子群优化(PSO)算法初始粒子群,避免了初始粒子群的随机性,提高了粒子群优化算法的优选能力;采用PSO算法训练RBF神经网络中的所有参数.数值结果表明,改进的混合算法具有更高的分类准确率。  相似文献   

17.
一种确定最佳聚类数的新算法   总被引:1,自引:0,他引:1  
针对K-均值聚类算法需要事先确定聚类数K的问题,将粒度计算引入样本相似度函数,定义了新的样本相似度,用模糊等价聚类确定数据集可能的最大类簇数Kmax.以Kmax为搜索上界,利用改进全局K-均值聚类算法,以BWP(Between-Within Proportion)为聚类有效性度量指标,提出确定最佳聚类数的一种新方法.通过UCI机器学习数据库数据集以及随机生成的人工模拟数据集实验测试,证明该算法不仅能有效确定数据集的最佳聚类数,而且适用于大规模数据集,但是会受到噪音点影响.  相似文献   

18.
针对中文文本聚类受语义、 语法、 语境等因素的影响, 在使用传统向量空间模型向量化表征后, 文本向量之间相互独立, 语义关系被忽略, 影响聚类分析结果的问题, 提出一种基于语义簇的中文文本聚类算法. 该算法根据词共现的原理和语义相关性, 首先使用词频-逆向文档频率(TF-IDF)方法求得特征词权重, 利用特征词的搭配向量构建语义簇; 然后使用特征词及其搭配词的权重, 将特征词向语义簇中心进行空间变换, 求得嵌入语义信息的文档向量; 最后利用文档向量进行K-means聚类分析. 实验结果表明, 该向量化表示方法, 能有效提高文本向量对文本语义的逼近能力, 同时可提高文本聚类结果的准确率和召回率.  相似文献   

19.
目的探索同时确定K-means算法的最佳聚类数K和最佳初始聚类中心的方法,使K-means算法的聚类结果尽可能地收敛于全局最优解或近似全局最优解。方法以次胜者受罚竞争学习(Rival Penalized Competitive Learning,RPCL)作为K-means的预处理步骤,以其学习结果作为K-means的聚类数和初始聚类中心并依据数据集样本自然分布定义样本密度,将此密度引入RPCL的节点权值调整,以此密度RPCL的输出作为K-means的最佳聚类数K和最佳初始聚类中心。采用UCI机器学习数据库数据集以及随机生成的带有噪音点的人工模拟数据集进行实验测试,并用不同的聚类结果评价指标对聚类结果作了分析。结果提出的密度RPCL为K-means提供了最佳的类簇数和最佳的初始聚类中心。结论基于密度RPCL的K-means算法具有很好的聚类效果,对噪音数据有很强的抗干扰性能。  相似文献   

20.
封闭环境中远距离语音识别会受到混响效果的影响,从而降低语音识别率。混响建模(reverberation modeling for speech recognition,REMOS)是一种在模型域进行混响补偿的新方法,该方法在已知声源位置的情况下能有效提升远距离语音识别精度。但在实际应用中,往往难以预测声源的位置。利用最大后验概率的原理,基于对房间不同区域进行有区别补偿的思想,在按帧的隐马尔可夫模型 (hidden Markov model,HMM)补偿的基础上,提出一种在封闭环境中新的模型补偿方法。该方法利用K均值聚类K-means算法对房间冲击响应 (room impulse response,RIR)的优化集进行聚类,对所属相同类的混响模型进行合并处理,再把合并后的混响模型载入维特比算法中,对清晰语音的HMM模型进行按帧补偿。最后采用后验概率方法选择最佳补偿,使得模型域的混响补偿能最接近精确补偿。实验证明,该方法能进一步提升远距离语音识别的精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号