首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
当前非特定人语音识别算法大多只适于连续语音,且识别精度和速度均较低。为此,提出一种新的基于BP神经网络的非特定人语音识别算法。介绍了标准BP神经网络,针对其收敛速度慢的弊端,通过变化的自适应学习速率,令网络训练针对各种阶段自行设置学习速率值;利用变学习速率构建对应的改进BP神经网络模型。将改进的BP神经网络模型看作识别非特定语音的识别器,输入待识别语音,令累计预测残差达到最小,实现非特定人语音识别。将改进模型应用于非特定人语音识别中进行验证。结果表明所提算法识别率更高、识别速度更快,不仅适于连续语音的识别,也适于不连续语音的识别。  相似文献   

2.
当前非定特人语音识别算法大多只适于连续语音,且识别精度和速度均较低。为此,提出一种新的基于BP神经网络的非特定人语音识别算法,介绍了标准BP神经网络,针对其收敛速度慢的弊端,通过变化的自适应学习速率,令网络训练针对各种阶段自行设置学习速率值,利用变学习速率构建对应的改进BP神经网络模型,将改进的BP神经网络模型看作识别非特定语音的识别器,输入待识别语音,令累计预测残差达到最小,实现非特定人语音识别。将改进模型应用于非特定人语音识别中进行验证,结果表明所提算法识别率更高、识别速度更快,不仅适于连续语音的识别,也适于不连续语音的识别。  相似文献   

3.
随着人工智能行业的不断发展,智能语音问答技术逐步得到国内外学者的广泛关注和研究,但是语音识别方面仍然存在两个技术瓶颈,第一是语音识别系统,第二是根据识别的语音进行问题的回答。基于此,开展了基于深度学习的智能语音问答系统研究。首先介绍了基于隐马尔科夫模型的语音识别系统,然后研究了基于梅尔频率的语音信号特征提取技术,并建立了声学和语言模型,最后研究了基于GRU算法的问答匹配模型,并基于以上模型开发了智能语音问答系统。经实际实验验证分析,文章所提出的算法在语音识别和问答的准确度方面都相比传统算法具有很高的精确度,本算法具有较大的实用价值。  相似文献   

4.
为了使语音认证算法在真实噪声环境下具有更强的鲁棒性,提出一种基于伪谐波模型的强鲁棒语音感知哈希认证算法.该算法首先对待认证语音进行预处理后分帧、加窗;然后通过输入一定的参考频率对每帧信号构造伪谐波模型,使每个频率对应一个单一成分的模型分析信号,并利用模型分析信号的突出幅度信息作为语音信号的感知特征值;最后对感知特征值进行哈希构造,生成二进制感知哈希序列来实现语音认证.实验结果表明:该算法对较强的真实环境噪声和一些常规的内容保持操作具有非常好的鲁棒性,同时区分性和认证效率能够满足语音通信实时性的要求.  相似文献   

5.
研究一种基于神经网络的端到端中文语音识别算法.算法将语音信息处理为频谱图,基于频谱图,设计和实现一种基于卷积神经网络和循环神经网络的深度学习模型结构用于中文语音识别.模型以汉字作为标签样本,运用训练算法和序列损失函数进行模型迭代训练最终模型;采用开源数据集,通过实验验证网络结构对识别效果的影响,同时对比传统的语音识别算...  相似文献   

6.
大数据时代为深度学习在语音识别中的应用提供了良好的平台.本文介绍了用于语音识别的深度学习模型及用于语音识别的深度学习的学习过程.语音识别技术中特征提取、模式匹配和模型训练都离不开大量训练数据的积累和匹配,而数据的可靠和有效依赖于算法的可行性.在大数据基础上,深度学习用于语音识别大大提高了识别率.  相似文献   

7.
文章研究了两种不同语音识别算法—动态时间伸缩算法(DTW)和隐马尔可夫模型(HMM),并在模式匹配原理的基础上,设计、实现了在Matlab环境中,应用DTW识别法及HMM识别法的孤立字语音识别实验平台。  相似文献   

8.
利用计算机识别少数民族语音是保护和传承民族文化的重要手段。白族是祖国西南边陲重要的少数民族之一,其历史悠久,文化灿烂。为实现使用白族语进行人与计算机的语音交互,提出了一种基于HTK的白族语音词识别方法。该方法针对白族语的发音特点,以音素为基本识别单元,利用HTK工具提取39维MFCC语音特征参数,构建HMM模型,采用Viterbi算法进行模型训练和匹配来实现白族语音的识别。实验表明,算法的识别准确率达到93-3%。该方法识别准确率高,为研究少数民族语音识别提供了有益的借鉴。  相似文献   

9.
语音识别中HMM与自组织神经网络结合的混合模型   总被引:9,自引:0,他引:9  
基于隐马尔可夫模型和自组织神经网络模型提出了一种用于语音识别的混合模型,给出了训练调整权向量的算法,实验结果表明其在语音识别中具有很好的性能·  相似文献   

10.
变异特征加权的异常语音说话人识别算法   总被引:1,自引:1,他引:0  
常用的加权算法难以跟踪非常态语音特征的变异,为此,文中提出了一种变异特征加权的异常语音说话人识别算法.首先统计大量正常语音各阶MFCC特征的概率分布,建立正常语音特征模板;然后用测试语音特征与正常语音特征模板之间的K-L距离和欧氏距离来度量语音的变异程度,确定K-L加权因子和欧氏加权因子;最后利用加权因子对测试语音的MFCC特征进行加权,并将加权后的特征输入高斯混合模型进行异常语音说话人识别.实验结果表明,文中提出的K-L加权和欧氏加权的异常语音说话人识别算法的整体识别率分别为46.61%和42.25%,而基于各阶特征对说话人识别贡献的加权算法和不加权算法的整体识别率分别为39.68%和36.36%.  相似文献   

11.
本文结合我国标准的管制指令用语特点,从语音识别模板库建立的基础技术出发,研究和分析了语音识别的端点检测、特征参数提取、模板库的训练等关键技术,并对多种处理的模型和算法进行了分析和对比,为我国管制指令语音识别模板库的建立提供了理论依据。  相似文献   

12.
为提高汉语连续语音识别系统的性能,建立了音节间相关的半音节识别单元,并研究了基于这种单元的连续语音识别算法。讨论了基于 D D B H M M 模型和最大后验概率估计准则的连续语音识别的理论基础,依据动态规划的基本原理,提出了一种基于音节间相关的识别单元的汉语连续语音识别算法。依照这种算法,不但能得到最优句子侯选,而且能够在识别过程中得到音节格(即 Nbest句子侯选)的数据结构。最后通过大词汇量非特定人连续语音识别的实验,表明了采用音节间相关的识别单元比基本的识别单元误识率有明显的降低  相似文献   

13.
利用段长信息的改进连续语音识别算法   总被引:1,自引:1,他引:1  
以基于段长分布的隐含Markov模型为基础,提出了一种改进的帧同步束搜索连续语音识别算法,使段长信息在连续语音识别中得到充分有效的利用,并与原算法作了比较。在该算法的具体实现上,建立了状态的局部路径组和全局活跃路径两种数据结构,并采用了帧同步快速实时算法来处理局部路径的剪枝和跳转。说明了段长参数的估计方法。介绍了非特定人大词汇量连续语音识别的实验,实验结果表明,利用段长信息改进识别算法比原识别算法字的误识率降低了6%。  相似文献   

14.
改进的神经网络快速学习算法   总被引:1,自引:0,他引:1  
提出了一种新颖的神经元模型和用于神经网络训练的推广准则,给出了多层神经网络的快速学习算法,研究了一种用于语音识别的时变多层神经网络及其相应的快速学习算法.语音识别实验表明:所给出的快速学习算法能有效地加速网络训练进程.  相似文献   

15.
语音识别模型中帧间独立假设在给模型计算带来简洁的同时,不可避免地降低了模型精度,增加了识别错误。该文旨在寻找一种既能满足帧间独立假设又能保持语音信息的特征。分别提出了基于k均值和基于归一化类内方差的语音识别自适应聚类特征提取算法,可以自适应地实现聚类特征流的提取。将该自适应特征分别应用在Gauss混合模型-隐Markov模型、基于段长分布的隐Markov模型和上下文相关的深度神经网络模型这3种语音识别模型中,与基线系统进行了实验对比。结果表明:采用基于归一化类内方差的自适应特征可以使得3种语言模型的识别错误率分别相对下降10.53%、5.17%和2.65%,展示了语音自适应聚类特征的良好性能。  相似文献   

16.
维吾尔语是一种黏着语,基于单词的语言模型不太适合于维吾尔语大词汇连续语音识别任务。该文提出了适合维吾尔语的基于音节的语言模型,引入最大匹配分词算法评价音节语言模型在大词汇连续语音识别任务中的单词识别性能。实验结果表明:基于音节的语言模型在未登录词和模型复杂度等方面表现出比基于单词的语言模型更加优越的性能,并且使识别系统的单元错误率比基于单词的系统减少了50%。因此,在维吾尔语语音识别任务上可以将音节作为识别单元。  相似文献   

17.
语音识别系统的识别率十分依赖基于Hidden Markov Models(HMM)模型的训练技术.然而,经典的训练算法(Baum-Welch算法)有一个致命的缺陷,即所得最终解依赖于初始值的选取,只得局部最优解,这就影响了系统的最终识别率.针对传统语音识别系统识别率较低的现状,提出了一种改进的小波变换HMM语音识别算法.该算法首先通过小波变换对原始语音信号进行了降噪处理,然后使用语音样本对利用遗传算法改进后的HMM模型进行训练,并用于语音识别.实验结果表明:所提出的算法实用有效,识别率显著提高.  相似文献   

18.
矢量量化(VQ)是语音识别中广泛采用的数据压缩和编码方法。在实现孤立词识别系统时VQ算法能简单、快速、有效地实现语音命令的实时识别。本文讨论了VQ(vector quantization)算法与语音遥控系统设计,实验结果表明基于VQ的语音识别获得了较好的识别结果。  相似文献   

19.
基于MFCCG-PCA的语音情感识别   总被引:1,自引:0,他引:1  
针对语音情感值维度大、难处理的问题, 结合MFCC改进算法和PCA模型, 进行二次优化, 提出一种新的语音情感值提取模型MFCCG-PCA。多组实验表明, 相比一般的MFCC模型, MFCCG-PCA模型在语音情感识别方面的性能有较大提高。  相似文献   

20.
针对多候选汉语音节网格语音关键词检索任务,在Gauss混合模型以及多候选识别算法方面进行了研究改进。首先探讨了Gauss混合模型的不同简化策略并用实验进行了验证,证明了全协方差矩阵在识别性能上的优越性;随后对经典的多候选令牌传递算法做出了针对汉语特点的改进。实验表明这2方面的研究不仅提高了以音节作为输出的语音识别引擎的单候选识别效果,也大幅提高了多候选的识别性能。最后搭建了一个基于多候选网格的语音关键词检索系统,在该系统中验证了上述改进的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号