共查询到20条相似文献,搜索用时 15 毫秒
1.
文章介绍了语音识别的技术、应用领域和藏语语音识别技术的现状,以及语音识别的基本原理及识别的过程分析,探讨了藏语语音识别技术中的难点问题,并展望藏文语音识别技术的发展方向和前景。 相似文献
2.
《东北师大学报(自然科学版)》2015,(4)
根据听觉语音学的知识,提出使用稀疏自动编码器在MFCC特征基础上进行深度学习,提取了深度特征模仿听觉神经的稀疏触动信号,有利于HMM模型语音识别精度的提高.实验结果显示,学习到的深度特征较MFCC特征在藏语语音识别正确率方面有明显提高. 相似文献
3.
《西北民族学院学报》2017,(4):19-23
清浊音识别在语音处理技术中具有非常重要的意义,其准确度对后续的语音处理有很大的影响.文章根据藏语言文字的特征提取了藏语有声段语音的短时能量、短时过零率以及短时自相关等参数,并通过对语音进行短时时域分析,研究了藏语的清浊音识别方法.实验证明,此方法在藏语辅音字母的清浊音识别中获得良好的效果,该方法为进一步深入研究藏语语音技术提供了一定的参考依据. 相似文献
4.
《西北师范大学学报(自然科学版)》2015,(5)
针对藏语读音首先看后加字,然后根据元音的位置关系决定读音,而且元音比辅音携带更多听觉感知信息的特点,提出了一种改进的HTK系统藏语孤立词语音识别技术.在识别特征参数中,增加更能表征元音特征的共振峰参数提高语音识别的正确性,通过循环迭代方法提高语音训练速度,利用藏文字母拉丁转写方法解决藏文和语音识别系统编码不一致的问题.在二次开发的HTK平台进行实验,正确率达到92.83%,实验结果表明元音特征在藏语音识别中起到重要作用. 相似文献
5.
基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点, 将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中, 可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明, 瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。 相似文献
6.
藏语语音识别技术研究已成为当今一大热点,而端点检测则是语音识别预处理阶段的关键环节之一。文章以标准拉萨藏语为对象,通过将加窗、短时能量和过零率相结合的方法对藏语语音识别技术中端点检测的算法进行了研究。实验表明,采用上述三种算法相结合的研究方法对浊音较重的藏语语音识别较为合适,可显著提高识别率。 相似文献
7.
8.
端到端的语音识别通过用单个深度网络架构表示复杂模块,减少了构建语音识别系统的难度.文中对传统的混合链接时序分类(Connectionist temporal classification, CTC)模型和基于注意力机制(Attention-based)模型的端到端语音识别架构进行了改进,通过引入动态调整参数对CTC模型和基于注意力机制模型进行线性插值,从而实现混合架构的端到端语音识别.将改进后的方法应用在中文普通话语音识别中,选择带投影层的双向长短时记忆网络(Bidirectional long short-term memory projection, BLSTMP)作为编码器网络模型,声学特征选取80维的梅尔尺度滤波器组系数和基频共83维特征.实验结果表明,与传统的端到端语音识别方法比较,文中方法在普通话语音识别上能够降低3.8%的词错误率. 相似文献
9.
10.
藏语特征提取算法是藏语语音识别系统中最为关键的一个环节。文章在分析藏语发音特点的基础上,建立了基于模拟人耳听觉系统的Mel倒谱系数(MFCC)特征提取算法,然后通过LDA信息压缩算法,对提取的特征数据进行压缩,在降低维数的同时提高了识别率和运算效率,总结出了符合藏语语音特点的LDA-MFCC特征提取算法。 相似文献
11.
李积逊 《青海师范大学学报(自然科学版)》2008,(4):42-44
在藏语语音处理中基音周期的检测具有非常重要的意义.本文首先讨论了用自相关函数法进行基音周期检测的基本原理及其改进方法,进而研究了这种方法在藏语语音处理中的应用,并给出了相应的实例. 相似文献
12.
采用语料库方法,构建了一个具有4500余条词的白马藏语语音库,并做了规范的音标标注。该库涵盖了《藏语方言调查表》91%的词汇,包含了白马藏语固有的语音和词汇特征,完全能够代表白马藏语普遍的语言现象。依据语音库标注信息,从发音部位和发音方法两方面对白马藏语声母和韵母的音位系统进行了统计分析,获得了详细的白马藏语音系数据。同时,按发音方法归纳了声母与韵母的组合规律及其分布特征,总结了白马藏语语音与藏语书面语的对应关系,为今后的白马藏语研究提供了详实的数据和新的研究思路。 相似文献
13.
14.
针对藏语言的特点,提出基于隐马尔可夫过程(HMM)的概率统计模型,用可观测的藏语文本信息预测重音标注,提出了初步设想. 相似文献
15.
说话人性别识别是语音识别研究中的一个重要分支.通过说话人的语音识别作为说话人性别识别的预分类技术可以降低研究问题的复杂度,提高系统的准确率.文中首先从建立的藏语语音性别库入手,提取语音的特征参数MFCC,进而利用SVM进行训练和识别.实验结果表明:用于说话人识别的MFCC特征能有效地用于藏语说话人性别识别,且与SVM联... 相似文献
16.
17.
藏语语音信号降噪算法研究 总被引:1,自引:0,他引:1
藏语语音在识别过程中会受到各种信号的干扰,从而影响语音识别的质量。在进行语音识别预处理过程中,语音信号的降噪技术是一个关键的环节。文章通过分析各种降噪手段,重点研究了藏语语音信号降噪方法,提出了符合藏语语音信号降噪的小波包降噪算法。其研究结果为进一步的藏语语音识别技术的研究提供了基础。 相似文献
18.
藏语孤立词语音识别系统研究 总被引:3,自引:0,他引:3
藏语语音研究相当滞后,文章结合语音识别知识和藏语特点,尝试性地研究了藏语孤立词语音识别研究.首先提取MFCC参数作为语音特征参数,形成语音模板库,采用DTW模型实现了语音识别系统,并且针对藏语孤立词多音节的特点,改进了传统的基于短时能量和短时过零率双门限检测法,即加入了音节间静音段时长门限,提高了孤立词语音信号检测的准确性和识别率. 相似文献
19.
20.
本文简要地分析了当前呼叫中心中传统IVR系统存在的问题,介绍了语音识别技术在呼叫中心的作用,阐述了利用Asterisk的拨号方案和AGI接口开发语音识别功能的原理,最后给出了在AGI程序中调用语音识别引擎实现呼入用户语音信息识别的过程. 相似文献