首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点, 将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中, 可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明, 瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。  相似文献   

2.
针对藏语读音首先看后加字,然后根据元音的位置关系决定读音,而且元音比辅音携带更多听觉感知信息的特点,提出了一种改进的HTK系统藏语孤立词语音识别技术.在识别特征参数中,增加更能表征元音特征的共振峰参数提高语音识别的正确性,通过循环迭代方法提高语音训练速度,利用藏文字母拉丁转写方法解决藏文和语音识别系统编码不一致的问题.在二次开发的HTK平台进行实验,正确率达到92.83%,实验结果表明元音特征在藏语音识别中起到重要作用.  相似文献   

3.
肖薇  李奇  冯南 《科学技术与工程》2004,4(12):1016-10181023
采用分布武语音识别(DSR)模式来设计和实现手机的语音拨号系统:在手机端进行特征参数的提取,然后通过无线信道传输到服务器端进行识别与训练,最后把结果送回到手机端。通过试验发现,该语音拨号系统识别率在90%以上,并且大大提高了语音质量和识别的速度。  相似文献   

4.
本论述通过实验语音学的方法,运用语音格局理论,从元音格局的角度对藏语拉萨话元音进行分析,考察元音的定位特征、内部变体的表现以及整体的分布关系。藏语拉萨话元音格局的分析,对于认识藏语拉萨话元音中所表现的元音规律以及它们各自的个性特征都是极有意义的。  相似文献   

5.
藏语语音合成语料库的好坏对合成语音质量有很大的影响。本文介绍了藏语拉萨话语音合成语料库的设计过程,语料的设计考虑了内容上和语义上的完整性,利用Greed算法实现对语料的选取,同时严格按照标准的录音过程对语料进行录制,最后设计了一套韵律标注规则对语料库中的语音数据进行了音段特征和超音段特征的标注,基本完成了藏语拉萨话语音合成语料库的建立。  相似文献   

6.
文章介绍了一种基于DSP技术的电视机语音拨号遥控器.该设计采用了美国TI公司推出的语音识别芯片TMS320C5402,在不对电视机做任何改动的情况下,实现声控,介绍了该语音拨号器的性能与特点,以及基于定点DSP实现的语音训练和语音识别算法的流程图.  相似文献   

7.
藏语语音识别技术研究已成为当今一大热点,而端点检测则是语音识别预处理阶段的关键环节之一。文章以标准拉萨藏语为对象,通过将加窗、短时能量和过零率相结合的方法对藏语语音识别技术中端点检测的算法进行了研究。实验表明,采用上述三种算法相结合的研究方法对浊音较重的藏语语音识别较为合适,可显著提高识别率。  相似文献   

8.
语音语法是自动语音识别的重要参考依据.在基于Voice XML的语音增值业务中应用越来越广泛.介绍了VoiceXML与语法的关系.描述了语音识别原理.推导出了常用的Nuance语法形式逻辑表达式.在此基础上,构建了一个语音拨号系统,并着重阐述了其中语音语法的应用.  相似文献   

9.
文章就语音增强的发展历程以及面向藏语语音的研究现状和语音特征作了介绍和分析,并选择藏语拉萨话作为语音增强实验的语种.文章选择经典的谱减法作为语音增强方法,并介绍了谱减法原理,同时设计实验方案,实验语料使用纯净语音和噪音混合成的带噪语音,按照不同信噪比进行语音测试,得到了大量数据结果.在分析结果的基础上得出结论:使用谱减法能够明显提升语音质量,提升效果随着噪音语音相关度的多少而变化.  相似文献   

10.
藏语语音信号降噪算法研究   总被引:1,自引:0,他引:1  
藏语语音在识别过程中会受到各种信号的干扰,从而影响语音识别的质量。在进行语音识别预处理过程中,语音信号的降噪技术是一个关键的环节。文章通过分析各种降噪手段,重点研究了藏语语音信号降噪方法,提出了符合藏语语音信号降噪的小波包降噪算法。其研究结果为进一步的藏语语音识别技术的研究提供了基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号