首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
针对单一声学特征和k-means算法在说话人聚类技术中的局限性,为了更好地表达说话人的个性信息并提高说话人聚类的准确率,将特征融合和AE-SOM神经网络应用于说话人聚类中,提出一种改进的说话人聚类算法.该算法通过对语音信号特征分析,将MFCC特征参数和LPCC特征参数相结合,从而完善说话人的个性信息.并在k-means...  相似文献   

2.
蔡铁  朱杰 《上海交通大学学报》2005,39(12):1997-2001
针对语音识别系统中快速说话人自适应问题,提出了一种支持说话人权重算法.该算法通过支持说话人的计算实现了说话人选择与自适应参数的降维,减少了自适应时的存储量,有效提高了自适应数据较少时的性能.有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对非特定人(SI)系统下降了5.82%,明显优于其他快速自适应算法.  相似文献   

3.
陈雪芳 《科学技术与工程》2013,13(12):3297-3300
提出了基于远近距离的说话人聚类算法:首先,使用端点检测算法把语音分割成读音段,然后,采用T2公式对近距离的说话人语音段进行聚类得到语音块,最后,使用谱聚类的方法估计说话人数目,对远距离的说话人(语音块)进行聚类。实验结果表明,在近距离的说话人聚类中,使用T2公式比使用BIC和KL在语音块准确率方面分别高出2.62%和13.84%,在远距离的说话人聚类中,使用谱聚类算法基本上可以把语音中的说话人数目计算出来,当说话人数目为15时,类纯度和说话人纯度可以达到78%,说明该算法可以有效地对说话人进行聚类。  相似文献   

4.
连续语音识别中的说话人快速自适应技术   总被引:2,自引:0,他引:2  
语音识别技术中说话人快速自适应技术受到普遍关注。该文综述了说话人快速自适应技术在国际上的研究现状 ,并且介绍了本研究组提出的快速自适应方法 ,即最大似然模型插值快速自适应框架及插值算法。与现有的相关自适应方法相比 ,该算法在更复杂的识别系统上同时实现了均值和协方差的自适应 ,并取得较好的自适应效果。当仅有一句自适应数据时 ,识别系统的误识率从 2 8.75 %下降到2 4 .93%。  相似文献   

5.
针对特征语音说话人自适应算法的缺陷,提出了基于结构化特征语音模型的区别性说话人自适应方法.该算法能根据自适应数据量调整自适应参数,并采用基于最大互信息量准则的区别性参数估计方法,进一步提高了自适应性能.有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对下降了6.7%,同时算法表现出了优于特征语音自适应方法的渐进性能.  相似文献   

6.
为解决语音识别系统实用中的说话人口音快速自适应问题,提出了一种动态说话人选择性训练方法。基于说话人选择性训练方法,采用基于Gauss混合模型似然分数计算的置信测度选择训练用说话人,改变训练用说话人的绝对数目选取方式,提高了选取的效能并拓展了选取标准的推广性。根据各个训练用说话人同被适应说话人的不同似然程度,加权地合成动态说话人选择性训练的语音模型,提高了自适应训练的效果。实验表明:该方法使识别率从80.16%提高到84.12%,相对误识率降低了19.96%,在实用中提高了基线系统的识别性能。  相似文献   

7.
将神经网络预测模型(NPM)应用于说话人识别中,经过实验,获得了较满意的结果。这说明神经网络对于说话人识别是一种很有潜力的方法。  相似文献   

8.
目前谱聚类在文本分类、图像分割和信息检索等领域的应用越来越引起研究者的重视,并取得了一定的成果、但是,大多数已有的谱聚类算法需要事先给定聚类数.在k-means算法、EM等聚类方法中也存在相似的问题、在此介绍了一种简单的容易实现的谱聚类算法,可以自动确定合适的聚类数.实验表明本算法结果很好、  相似文献   

9.
基于组合神经网络的与文本无关的说话人识别   总被引:1,自引:1,他引:0  
提出了一种用于N个说话人识别的组合神经网络,由N个子网组成,每个子网完成两类模式区分,将这N个子网组合起来完成N类模式的区分.子网选用RBF神经网络,并给出了自组织选取中心的方法.实验显示,对6名说话人,识别率达到94%.对10名说话人,识别率达93.17%.  相似文献   

10.
为有效找出会议语音中的说话人角色个数及各角色的说话人语音,提出了一种多说话人角色聚类方法.首先定义说话人角色聚类的特征,然后采用测地距离度量特征的相似度,进而提出了一种利用类内距离来控制类间合并的多说话人角色聚类方法,最后采用4种不同类型的会议语音对该方法进行测试.结果表明:对手工分割和自动分割后的会议语音进行说话人角色聚类时,如果采用相同的聚类方法,则使用测地距离的性能优于使用传统距离的性能;如果采用相同的距离度量方法,则文中方法的性能优于传统层次聚类方法.  相似文献   

11.
基于组合神经网络和模糊聚类的话者分类   总被引:2,自引:0,他引:2  
基于话者分类的自适应语音识别是实现非限定人、大字表语音识别的一种很有前途的有效方法.本文设计了一种用于话者分类的主从式组合神经网络,以神经预测模型作为从网络,可以从短语音(一个音节,约0.3秒)中有效地提取、规正和压缩话者个人性信息;主网络采用具有很强聚类功能的自组织特征映射网络.针对话者个人性信息的模糊性,提出了模糊系统聚类算法和双类心聚类算法.实验验证了组合神经网络对于话者分类的有效性以及模糊聚类算法对不同文本的语音样本具有较好的适应性  相似文献   

12.
在分析自组织特征映射(SOFM)神经网络基本学习算法的基础上.从提高算法收敛速度和性能出发.提出了一种改进算法:随机选择样本输入次序;根据实际应用并结合专家经验确定初始连接权值;采用高斯函数作为拓扑邻域函数;将算法分成排序和收敛两个阶段。并分别采用不同的学习率和邻域函数.采用改进后的SOFM算法对输入样本进行自组织聚类,再利用学习矢量量化(LVQ)算法解决样本分类中的交迭问题。提高了分类精度.仿真实验结果表明.该网络能够识别常用的数字(0~9)和英字母.特别是在有噪声污染的情况下.可以获得较好的效果。  相似文献   

13.
 由于说话人的语音信号具有时变性、随机性,其特征参数也呈现出高维及相邻帧变化较大等特点。从量子信息处理理论出发,将一帧语音信号视为一个量子态,在传统神经网络的基础上,利用量子逻辑线路构造神经网络,实现说话人语音信号的有效聚类,探索一种基于量子逻辑线路神经网络的说话人识别模型与方法。利用模型固有的大量全局吸引子,可有效降低语音信号处理的时间及复杂度。通过在经典计算机上模拟仿真,并与BP神经网络说话人识别模型进行对比,表明该方法能够加快说话人识别模型的收敛速率,对参数变化具有更好的鲁棒性,且其系统识别率比BP神经网络方法平均提高了3.34%。  相似文献   

14.
将模糊协方差距离测度引入到竞争学习型神经网络的参数控制中,采用批处理的网络学习方式消除数据样本顺序对网络权重调整的影响,通过淘汰及合并数据集的冗余类实现对未知类别数、多种分布型数据的自适应聚类.实验表明,新网络对数据集的分布形式有较强的鲁棒性,并能正确确定数据集的类别数.  相似文献   

15.
通过对天津海岸带遥感图像的研究,提出了基于树型增长神经网络模型的遥感图像聚类方法。该方法申神经模型的网络结构在训练过程中动态生成,用户可根据需要实现层次聚类,同时可以通过调节扩展因子SF的大小调节聚类的速度和精度,从而提高了聚类的精度和灵活性。  相似文献   

16.
基于话者分类和HMM的话者自适应语音识别   总被引:2,自引:1,他引:2  
本文提出了一种基于话者分类和HMM的话者自适应语音识别方法,采用对参考话者聚类、并按话者类分别建立HMM模板的策略,对于新注册的用户,系统只需利用其极少量的语音,便可将与之最相近的一类模板指派给新用户,再采用基于谱空间映射的两级自适应方法,使系统自适应到用户的模式下工作.这种方法既提高了识别性能,又降低了自适应的难度,还有利于HMM的建立.讨论了话者分类数和自适应语音数据对话者自适应效果及识别性能的影响,提出了一种在自适应语音数据不足情况下仍具有较好自适应效果的基于FVQ的码本自适应改进算法,该算法还具有对自适应字表不敏感的特点.  相似文献   

17.
为了解决动态环境下的说话人识别的辨认率问题,在识别阶段,把小生境粒子群算法应用于GMM之中。从实验得出,采用基于小生境粒子群的高斯混合模型提高了识别性能。  相似文献   

18.
提出了一种基于PCANN/PDP混合结构的实际环境下说话人识别的方法。它采用相继几帧组成的特征参数矢量作为说话人识别系统的输入,能有效地在说话人识别系统中引入帧间相关信息。针对噪声往往具有帧间相关性小,能量分布频率范围广且数值较小,在语音信号主分量特征中对应于贡献率较小的分量等特点,话人识别系统的前端增加语音参数压缩的主分量分析神经网络(PCANN)。同时提出了概率DP匹配说话人识别方法。通过对噪声环境下与文本无关的说话人识别实验,这种方法的有效性得到了验证。  相似文献   

19.
针对开集声纹识别的自适应阈值计算问题,提出一种基于大津算法和深度学习的阈值计算方法.首先,采用三层受限Boltzmann机堆叠而成的深度置信网络从Mel倒谱系数中提取语音深层特征;其次,通过Gauss混合模型计算特征的相似度值,对特征的相似度值使用大津算法计算阈值.实验结果表明,该方法识别效果较理想,与等错误率计算阈值...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号