首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 39 毫秒
1.
在传统的HMM语音识别方法的基础上,提出了两种改进的竞争神经网络算法,分别用于语音识别的两个不同方面.首先提出了一种基于选择机制的新的竞争算法,这种算法可以有目的性地避免局部最优,而且可以克服模拟退火算法(SA)的随机性.然后,针对分类器的特性,对竞争算法进行改进,把安全拒识措施结合到竞争算法中,提出了一种新颖的神经网络——并行、自组织、层次神经网(PSHNN).实验结果表明,基于竞争神经网络算法的语音识别系统比传统的语音识别系统在识别能力和识别速度上都有明显提高,从而证明了与竞争神经网络算法结合的语音识别方法是可行的,而且具有良好的发展和应用前景.  相似文献   

2.
语音信号是受说话人、环境等因素影响的复杂函数,人工神经网络(ANN)模型进行语音识别具有自适应、自组织及联想等特征,适合用于语音识别。主要研究了传统BP神经网络在实际语音识别中的改进方案。利用改进后的方案实现语音识别、网络结构简化、运算速度加快、训练时间缩短。  相似文献   

3.
用于SOM神经网络语音识别的自适应局部搜索算法   总被引:1,自引:0,他引:1  
采用一种基于自组织特征映射(SOM)神经网络和隐马尔柯夫模型(HMM)法结合的语音识别方法.根据语音信号的相关性,提出了一种自适应局部搜索算法.结果表明,该算法相对于全搜索算法而言,计算量小而又不降低识别率  相似文献   

4.
利用基因算法训练连续隐马尔柯夫模型的语音识别   总被引:2,自引:0,他引:2  
为了提高语音识别系统的性能,基于全域优化的思想,提出了一种用于训练连续隐马尔柯夫模型(CHMM)的新算法——基因算法,并将该算法用于语音识别.用该算法训练CHMM,可得到最佳的模型参数,从而提高了语音识别率.利用该算法训练CHMM,不需要对CHMM的每一个参数单独进行估值,能够在一定的程度上提高训练速度.文中阐述了整个算法,给出了计算机模拟结果,并与传统的训练方法进行了比较.  相似文献   

5.
针对短时语音时长过短以及训练语音和测试语音时长不等,导致语种识别性能大幅度下降的问题,提出了一种可变时长的短时广播语音多语种识别模型(Variable Duration-Language Identification, VD-LID).首先,对不同时长的语音进行时长规整;然后,对规整后的短时语音进行特征提取,提取其对数功率谱包络图作为语种特征;最后,将语种特征输入到残差神经网络中进行分类.实验结果表明,相比于传统特征输入,对数功率谱包络图特征将短时语音的语种识别准确率提高到了82.4%;相比于没有引入时长规整层的语种识别模型,VD-LID在测试语音时长为5 s和10 s的实验中,语种识别准确率分别提升了27.9%和37.7%.  相似文献   

6.
刘潇  和应民  陈力伟 《应用科技》2006,33(6):18-20,23
介绍一种适用于实时语音识别环境下的神经网络模型——动态识别神经网络(dynamic recognition neural network,DRNN).DRNN聚类学习的性能使得它非常适用于与在线学习方式相结合的实时语音识别系统.通过比较DRNN和隐含马尔科夫模型(hidden Markov model,HMM),可以看到不论是在训练方面还是在识别方面,DRNN算法的计算复杂程度都要低于HMM算法.  相似文献   

7.
语音信号时间动态规正新方法   总被引:5,自引:0,他引:5  
利用函数逼近原理,提出了一种语音信号时间动态规正的新方法,并由此导出了可用于神经网络语音识别的新特征。重点讨论了时间动态规正的原理、新特征的提取方法和性质。实验及理论分析表明,新特征对于神经网络语音识别及语音压缩具有很好的效果。  相似文献   

8.
本文提出了一种基于模糊矢量量化(FVQ)和隐马尔柯夫模型(HMM)模糊训练的语音识别新方法.利用模糊矢量量化替代了传统方法中的矢量量化,语音特征参数序列经过模糊矢量量化后得到模糊观察符号序列.在此基础上提取出一个反映训练样本总体随机变化特性的模糊观察符号序列,然后用它对该音节的HMM进行一次性全局训练,训练算法经传统的Baum-Welch算法改进得到.经十个汉语数字的对比实验表明,该训练算法大大提高了系统的训练速度,模糊矢量量化与传统的矢量量化相比,不仅提高了隐马尔柯夫模型的鲁棒性,进而提高了系统的识别率,而且在语音训练数据不充足的情况下,也能得到很好的识别性能.  相似文献   

9.
连接数字语音识别系统的DSP实时实现   总被引:2,自引:0,他引:2  
:针对各种数字信息,实现了一种基于TMS320C5x 评价模块(EVM)的与特定人无关的连接数字语音识别系统.在分析了连续概率密度的隐马尔可夫模型(CDHMM)基础上,利用LPC倒谱系数、LPC差分倒谱系数、能量归一化系数及其差分系数作为语音特征矢量,训练和识别采用Viterbi算法和Baum -Welch 重估算法,有效地提高了系统的识别率.给出了实现各个阶段所需的时间,比较了简单模板匹配法和隐马尔可夫模型法以及不同语音特征参数对识别率的影响.在具体实现中,着重处理了抗噪及实时实现问题.实验结果表明,本系统在普通机房条件下取得较满意的效果,正确识别率达到92% ,为其实用化提供了较为重要的技术途径.  相似文献   

10.
论述了基于神经网络模型的特定人汉语语音识别,并建立了一基于3层BP神经网络的汉语语音识别系统,对汉语10个数字(1 ̄10)进行识别实验,获得了较满意的识别结果。  相似文献   

11.
研究一种基于神经网络的端到端中文语音识别算法.算法将语音信息处理为频谱图,基于频谱图,设计和实现一种基于卷积神经网络和循环神经网络的深度学习模型结构用于中文语音识别.模型以汉字作为标签样本,运用训练算法和序列损失函数进行模型迭代训练最终模型;采用开源数据集,通过实验验证网络结构对识别效果的影响,同时对比传统的语音识别算...  相似文献   

12.
介绍了采用人工神经网络,特别是概率神经网络(PNN)技术进行语音识别的原理.提出了一类基于概率神经网络的解决元音识别问题的模型,并且通过一个试验,研究了用于语音识别的PNN模型中的参数设置.试验表明,该模型对于元音的识别具有较好的识别率.  相似文献   

13.
 由于说话人的语音信号具有时变性、随机性,其特征参数也呈现出高维及相邻帧变化较大等特点。从量子信息处理理论出发,将一帧语音信号视为一个量子态,在传统神经网络的基础上,利用量子逻辑线路构造神经网络,实现说话人语音信号的有效聚类,探索一种基于量子逻辑线路神经网络的说话人识别模型与方法。利用模型固有的大量全局吸引子,可有效降低语音信号处理的时间及复杂度。通过在经典计算机上模拟仿真,并与BP神经网络说话人识别模型进行对比,表明该方法能够加快说话人识别模型的收敛速率,对参数变化具有更好的鲁棒性,且其系统识别率比BP神经网络方法平均提高了3.34%。  相似文献   

14.
变帧率技术在语音识别中的应用   总被引:3,自引:0,他引:3  
变帧率(VFR)分析技术可以在语音识别时,用以丢弃那些特征非常相似的语音帧.文中分析了已有VFR方法的不足,并提出了一种新的VFR方法.这种新方法能够更加突出语音信号中发音变化区域.计算机模拟实验显示,经该方法预处理后的语音送入隐马尔柯夫模型的语音识别系统比传统算法有更高的识别率.  相似文献   

15.
为了解决语音识别中由网络加深导致的低层特征消失、参数量大及网络训练困难的问题,基于Inception V3网络的非对称卷积思想,提出了一种改进的密集连接卷积神经网络(densely connected convolutional neural networks, DenseNet)模型。根据语音识别的长时相关性,通过密集连接块建立起不同层之间的连接关系,从而保存低层特征、加强特征传播;为了得到尺度更丰富的声学特征,将卷积核的范围进行扩大;利用非对称卷积思想分解卷积核,以减少参数量。实验结果表明,相较经典深度残差卷积神经网络模型和原始DenseNet模型,提出的模型在THCHS30数据集上的语音识别性能更好,在保证识别率的情况下,还减少了网络参数量,提高了模型训练效率。  相似文献   

16.
噪声环境中基于HMM模型的语音信号端点检测方法   总被引:8,自引:1,他引:8  
在噪声环境下如何提高语音信号端点检测的准确性是自动语音识别(ASR)研究中的一个重要课题.常用的基于短时能量的端点检测方法对于能量较低的音节或在信噪比较低的环境下,检测性能不够理想.讨论了一种基于HMM模型的语音信号端点检测方法.先用训练的方法生成背景噪声和废料的模型,再用Viterbi解码算法对待测信号进行处理,并给出了具体的实现方法.实验测试结果表明,基于HMM的端点检测方法的检测性能接近于人工检测,方法是有效的.  相似文献   

17.
路畅 《科技信息》2007,(32):91-91,128
本文针对传统的基于HMM模型的语音识别效率较低的问题,提出了一种将隐马尔可夫模型(HMM)与自组织特征映射神经网络(SOFMNN)相结合的方法。  相似文献   

18.
对窗口神经网络(BWNN)与鲁棒HMM’s之间的关系作了新的探讨,指出了鲁棒HMM’s是循环的BWNN(RBWNN)的特殊情况。讨论了由RBWNN构造用于噪音环境下语音识别的组合HMM’s和二阶HMM’s的算法,给出了它们相应的网络结构。  相似文献   

19.
基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点, 将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中, 可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明, 瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。  相似文献   

20.
当前非特定人语音识别算法大多只适于连续语音,且识别精度和速度均较低。为此,提出一种新的基于BP神经网络的非特定人语音识别算法。介绍了标准BP神经网络,针对其收敛速度慢的弊端,通过变化的自适应学习速率,令网络训练针对各种阶段自行设置学习速率值;利用变学习速率构建对应的改进BP神经网络模型。将改进的BP神经网络模型看作识别非特定语音的识别器,输入待识别语音,令累计预测残差达到最小,实现非特定人语音识别。将改进模型应用于非特定人语音识别中进行验证。结果表明所提算法识别率更高、识别速度更快,不仅适于连续语音的识别,也适于不连续语音的识别。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号