首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
清浊音识别在语音处理技术中具有非常重要的意义,其准确度对后续的语音处理有很大的影响.文章根据藏语言文字的特征提取了藏语有声段语音的短时能量、短时过零率以及短时自相关等参数,并通过对语音进行短时时域分析,研究了藏语的清浊音识别方法.实验证明,此方法在藏语辅音字母的清浊音识别中获得良好的效果,该方法为进一步深入研究藏语语音技术提供了一定的参考依据.  相似文献   

2.
针对藏语读音首先看后加字,然后根据元音的位置关系决定读音,而且元音比辅音携带更多听觉感知信息的特点,提出了一种改进的HTK系统藏语孤立词语音识别技术.在识别特征参数中,增加更能表征元音特征的共振峰参数提高语音识别的正确性,通过循环迭代方法提高语音训练速度,利用藏文字母拉丁转写方法解决藏文和语音识别系统编码不一致的问题.在二次开发的HTK平台进行实验,正确率达到92.83%,实验结果表明元音特征在藏语音识别中起到重要作用.  相似文献   

3.
藏语语音识别技术研究已成为当今一大热点,而端点检测则是语音识别预处理阶段的关键环节之一。文章以标准拉萨藏语为对象,通过将加窗、短时能量和过零率相结合的方法对藏语语音识别技术中端点检测的算法进行了研究。实验表明,采用上述三种算法相结合的研究方法对浊音较重的藏语语音识别较为合适,可显著提高识别率。  相似文献   

4.
基于非特定发音人拉祜语孤立词语音识别研究   总被引:3,自引:2,他引:1  
选用200个拉祜语常用词,以词为识别单元,利用语音识别工具箱HTK开展非特定人拉祜语孤立词的语音识别研究.研究发现:特定发音人的识别率比较稳定,针对非特定发音孤立词,通过增加模型的混合高斯数目,其识别率得到显著提高,使得识别正确率保持在99%以内,为拉祜语孤立词识别提供了有效方法.  相似文献   

5.
基于语音识别的说话人身份辨识系统   总被引:2,自引:0,他引:2  
提出一种在小字库孤立语音条件下,集成语音识别与说话人的识别技术,并进行说话人身份代码(密码)识别、认证.利用语音信号的短时分析技术进行孤立词的单元分割,采用临界带特征矢量作为语音信号特征,分析了经典语音识别算法——动态时间规整算法,提出了对语音模板各帧加权的改进方法.为提高识别响应速度,研究了多门限多轮次的判决方法,在增加多套模板、提高识别率的情况下,降低了系统的响应时间.  相似文献   

6.
蔡柳  赵晨星 《甘肃科技》2008,24(5):46-48
随着对安多藏语语音识别技术的研究,端点检测发挥着重要的作用,准确的判断语音端点对识别性能有很大的影响。引用了双门限检测法对藏语语音进行端点检测实验,在实验中对短时平均过零率进行修正,克服了随机噪音的影响,取得了较好的效果。  相似文献   

7.
汉语语音识别中对孤立词、小词汇特定人的语音识别率较高,但对于连续的大词汇量语音识别率较差。把连续的大词汇语音实时自动地切分为单个音节,可以提高其系统的识别率。本文根据汉语语音在能量和频率等方面的特征,找到了短时平均幅度和短时平均过零率的方法来检测音节的端点,从而得到对文本文件中汉语语音的音节自动切分算法。  相似文献   

8.
随着深度学习理论的兴起,BLSTM-CTC模型成为目前主流的语音识别声学模型之一.本文借鉴国内外语音识别框架,结合藏语言文字特点,提出基于BLSTM-CTC模型的藏语语音识别方法.该方法以识别非特定人藏语连续语音为目标,通过提取语音的MFCC特征参数,建立了以音素为建模单元的藏语语音声学模型.在不同建模单元下LSTM-CTC模型和BLSTM-CTC模型的对比实验表明,该方法能够充分利用上下文信息,具有较强的建模能力和语音识别效果.  相似文献   

9.
藏语语音信号降噪算法研究   总被引:1,自引:0,他引:1  
藏语语音在识别过程中会受到各种信号的干扰,从而影响语音识别的质量。在进行语音识别预处理过程中,语音信号的降噪技术是一个关键的环节。文章通过分析各种降噪手段,重点研究了藏语语音信号降噪方法,提出了符合藏语语音信号降噪的小波包降噪算法。其研究结果为进一步的藏语语音识别技术的研究提供了基础。  相似文献   

10.
为提高识别率和识别效率,采用双门限过零率和短时能量作为端点检测的依据,提取Mel频率倒谱系数作为语音特征参数,并使用DTW算法进行模式匹配.由于传统DTW算法计算量大,所以采用局部路径约束和区域约束进行改进,并用Matlab对改进后的DTW算法进行了仿真.实验证明该算法对孤立词语音识别能够达到较好的识别结果.  相似文献   

11.
一种噪声环境下的语音识别方法(线性预测误差法)的研究   总被引:4,自引:0,他引:4  
介绍一种平稳噪声环境下语音识别的新的方法。该方法利用噪声的LPC系数去预测语音信号,从而得到LPC预测序列,然后把它代替原语音序列来进行语音端点的检测、语音特征的提取和在合适的匹配方式下的识别。实验结果表明:该法在噪声环境下自动检测语音端点和提取语音信号的特征是可行的,获得了很满意的识别率。  相似文献   

12.
藏语特征提取算法是藏语语音识别系统中最为关键的一个环节。文章在分析藏语发音特点的基础上,建立了基于模拟人耳听觉系统的Mel倒谱系数(MFCC)特征提取算法,然后通过LDA信息压缩算法,对提取的特征数据进行压缩,在降低维数的同时提高了识别率和运算效率,总结出了符合藏语语音特点的LDA-MFCC特征提取算法。  相似文献   

13.
阐述了Mel谱失真测度的概念,指出用Mel频率尺度可较充分地反映人耳对频率及幅度的非线性感知特性。在此基础上,针对孤立词语音识别,对常规LP倒谱特征提取方法进行改进,即将LP倒谱按符合人耳听觉特性的Mel尺度进行非线性变化,得到LP Mel倒谱系数(LPM-CC)作为特征参数。识别网络使用RBF神经网络,进行了孤立词语音识别。实验结果表明此种方法抗噪性能好,识别效率高。  相似文献   

14.
基于HTK的普米语孤立词的识别,通过对特定发音人和非特定发音人的语音进行特征分析、预处理、提取MFCC特征参数,从而建立每个普米词的HMM模型,最后采用Viterbi算法进行模型的训练和匹配.实验表明:对特定发音人和非特定发音人,随着普米词个数的增加,识别率虽有所下降,但是变化很小,识别率均超过了95.00%,识别效果很好.语料的信噪比和发音人的发音稳定性是导致识别率下降的重要原因.  相似文献   

15.
双门限算法是语音端点检测的一种重要方法,对藏语语音识别和处理具有重要意义。提出了用双门限端点检测技术对藏语语音进行音节分割的方法,首先根据双门限语音端点检测原理进行Matlab编程和仿真,然后结合藏语语音的音节特点和双门限算法分别在正常语速和慢语速环境下对藏语的30个辅音语音、随机抽取的双音节、三音节及句子语音进行双门限算法的音节分割和分析,实验表明双门限算法对没有太多连读音节的藏语语音和慢语速下长句的音节分割准确率较高。  相似文献   

16.
高性能汉语数码语音识别算法   总被引:13,自引:0,他引:13  
提出了一个高性能的汉语数码语音识别 (MDSR)系统。 MDSR系统使用 Mel频标倒谱系数 (MFCC)作为主要的语音特征参数 ,同时提取共振峰轨迹和鼻音特征以区分一些易混语音对 ,并提出一个基于语音特征的实时端点检测算法 ,以减少系统资源需求 ,提高抗干扰能力。采用了两级识别框架来提高语音的区分能力 ,其中第一级识别用于确定识别候选结果 ,第二级识别用于区分易混语音对。由于采用了以上改进 ,MDSR系统识别率达到了 98.8% .  相似文献   

17.
基于ZCPA和DHMM的孤立词语音识别系统   总被引:2,自引:0,他引:2  
介绍了用离散隐马尔可夫模型(DHMM)构造孤立词语音识别系统的过程,重点针对软件实现中的问题重新推导了Baum Welch算法的重估公式,引入一种抗噪性能很好的特征参数:过零率与峰值幅度特征,将该特征与DHMM结合用于孤立词识别系统。结果表明,此系统训练时收敛很快并且识别效果好。  相似文献   

18.
在大词表孤立词语音识别中,Viterbi搜索是时间消耗的主要因素。为改善基线系统性能,根据汉语孤立词识别的特点,提出了一种基于音节切分的束搜索算法,在音节层和词条层进行剪枝。该算法不增加内存开销。实验结果表明:在词表规模为10 000时,该算法以0.23%的识别率下降率为代价,将Viterbi搜索的时间消耗降低为基线系统的26.73%;相对于小词表,该算法在大词表情况下对系统性能的改善尤为明显。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号