首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 274 毫秒
1.
双门限算法是语音端点检测的一种重要方法,对藏语语音识别和处理具有重要意义。提出了用双门限端点检测技术对藏语语音进行音节分割的方法,首先根据双门限语音端点检测原理进行Matlab编程和仿真,然后结合藏语语音的音节特点和双门限算法分别在正常语速和慢语速环境下对藏语的30个辅音语音、随机抽取的双音节、三音节及句子语音进行双门限算法的音节分割和分析,实验表明双门限算法对没有太多连读音节的藏语语音和慢语速下长句的音节分割准确率较高。  相似文献   

2.
清浊音识别在语音处理技术中具有非常重要的意义,其准确度对后续的语音处理有很大的影响.文章根据藏语言文字的特征提取了藏语有声段语音的短时能量、短时过零率以及短时自相关等参数,并通过对语音进行短时时域分析,研究了藏语的清浊音识别方法.实验证明,此方法在藏语辅音字母的清浊音识别中获得良好的效果,该方法为进一步深入研究藏语语音技术提供了一定的参考依据.  相似文献   

3.
藏语语音信号降噪算法研究   总被引:1,自引:0,他引:1  
藏语语音在识别过程中会受到各种信号的干扰,从而影响语音识别的质量。在进行语音识别预处理过程中,语音信号的降噪技术是一个关键的环节。文章通过分析各种降噪手段,重点研究了藏语语音信号降噪方法,提出了符合藏语语音信号降噪的小波包降噪算法。其研究结果为进一步的藏语语音识别技术的研究提供了基础。  相似文献   

4.
藏语数字语音识别是藏语语音识别中的基础环节。文章以藏语数字语音信号产生的数学模型为研究对象,从频域、时域、倒谱域出发,对藏语数字语音识别进行了分析,重点论述了藏语数字语音识别的原理、仿真实验及测试方法。以藏语数字语音库为数据资源,对藏语数字语音建立了训练模型并从中提取语音特征,通过模板匹配算法,获取录音数据中待识别语音的模板。实验证明已建立语音库的识别率达100%,随机录音的识别率则达90%。  相似文献   

5.
藏语孤立词语音识别系统研究   总被引:3,自引:0,他引:3  
藏语语音研究相当滞后,文章结合语音识别知识和藏语特点,尝试性地研究了藏语孤立词语音识别研究.首先提取MFCC参数作为语音特征参数,形成语音模板库,采用DTW模型实现了语音识别系统,并且针对藏语孤立词多音节的特点,改进了传统的基于短时能量和短时过零率双门限检测法,即加入了音节间静音段时长门限,提高了孤立词语音信号检测的准确性和识别率.  相似文献   

6.
藏语语音识别技术研究已成为当今一大热点,而端点检测则是语音识别预处理阶段的关键环节之一。文章以标准拉萨藏语为对象,通过将加窗、短时能量和过零率相结合的方法对藏语语音识别技术中端点检测的算法进行了研究。实验表明,采用上述三种算法相结合的研究方法对浊音较重的藏语语音识别较为合适,可显著提高识别率。  相似文献   

7.
文章根据藏语的语音规律和特点,以统计声学模型为基础,对藏语语音合成系统中的语料库设计与建设、韵律信息及标注、模型设计与训练及语音合成等关键技术进行了分析,对藏语语音合成系统的实现具有一定的参考价值。  相似文献   

8.
针对语音信号特征提取在处理含噪语音信号时识别率低,抗干扰性差等问题,提出了一种基于改进的经验模态分解算法对含噪语音信号进行特征提取.该方法通过对含噪声语音信号分解分类并对两类模态分量分别处理再进行重构和特征提取,解决了目前大多数语音信号特征提取过程会滤掉部分原信号问题,在有效地消除了噪声信号的基础上,尽可能多地保存原信...  相似文献   

9.
随着深度学习理论的兴起,BLSTM-CTC模型成为目前主流的语音识别声学模型之一.本文借鉴国内外语音识别框架,结合藏语言文字特点,提出基于BLSTM-CTC模型的藏语语音识别方法.该方法以识别非特定人藏语连续语音为目标,通过提取语音的MFCC特征参数,建立了以音素为建模单元的藏语语音声学模型.在不同建模单元下LSTM-CTC模型和BLSTM-CTC模型的对比实验表明,该方法能够充分利用上下文信息,具有较强的建模能力和语音识别效果.  相似文献   

10.
藏语语音合成语料库的好坏对合成语音质量有很大的影响。本文介绍了藏语拉萨话语音合成语料库的设计过程,语料的设计考虑了内容上和语义上的完整性,利用Greed算法实现对语料的选取,同时严格按照标准的录音过程对语料进行录制,最后设计了一套韵律标注规则对语料库中的语音数据进行了音段特征和超音段特征的标注,基本完成了藏语拉萨话语音合成语料库的建立。  相似文献   

11.
基于HTK的普米语孤立词的识别,通过对特定发音人和非特定发音人的语音进行特征分析、预处理、提取MFCC特征参数,从而建立每个普米词的HMM模型,最后采用Viterbi算法进行模型的训练和匹配.实验表明:对特定发音人和非特定发音人,随着普米词个数的增加,识别率虽有所下降,但是变化很小,识别率均超过了95.00%,识别效果很好.语料的信噪比和发音人的发音稳定性是导致识别率下降的重要原因.  相似文献   

12.
基于非线性共振的说话人特征提取研究与仿真   总被引:1,自引:1,他引:0  
何朝霞  潘平 《科学技术与工程》2012,12(25):6507-6510
针对人发声系统的非线性特性和语音信号的类混沌特性,提出了一种基于非线性共振Duffing模型的说话人语音信号的特征提取方法。实验结果表明:采用非线性共振Duffing模型的特征提取方法,较基于非线性动力学提取广义维数特征具有较高的识别率。同时,同一语音信号在相同的识别系统中,与经典的MFCC特征相比,也具有较高的识别率。  相似文献   

13.
Mel 频率下基于 LPC 的语音信号深度特征提取算法   总被引:1,自引:0,他引:1  
针对传统语音信号二次特征提取方法在保证识别率的前提下,实时性较差的问题,提出一种Mel频率下基于线性预测系数(linear predictive coefficient,LPC)的改进的语音信号深度特征提取算法.该方法根据人耳的听觉特性把LPC在Mel频率下进行非线性变换,再进行微分、高阶微分和按比例重组等步骤,得到一种既考虑声道激励又兼顾人耳听觉的新特征参数,从而大大减少传统语音信号深度特征提取的计算量,在不影响识别效率的情况下,极大提高系统的实时性.最后,将该算法在智能轮椅平台进行有效性验证,大量实验表明,语音控制系统实时性差的问题在使用该算法后能够得到明显改善,该算法既保证了特征提取识别率,也有效地改善了系统的实时性.在一定程度上使语音控制智能轮椅更具实用性.  相似文献   

14.
汪兰兰  蔡昌新 《科学技术与工程》2022,22(26):11524-11532
针对目前常见的语音特征提取方法应用于真实环境中,所提取的语音特征包含有噪声干扰的问题,进而导致情感识别时出现的分类模糊化情况,为此提出一种新的语音特征提取方法,即线性预测基音频率特征提取方法。它主要是基于线性预测系数来构建模型,利用构建的模型消除声道响应信息以及抑制噪声干扰。由于此方法对于分类模糊化问题没有得到较好改善,利用模型相同的LPCMCC(LPC Mel cepstral coefficients,LPC美尔倒频谱系数)来对线性预测基音频率进行改进,并设计基于线性预测基音频率、其改进特征、LPCMCC与SVM(support vector machines,支持向量机)的语音情感识别对比实验。对比实验表明,此改进特征提取方法应用在情感识别领域的平均精度最高为84%,比线性预测基音频率和LPCMCC要高出22%、14%。为了测试此改进特征在真实环境中的分类效果,在此改进特征的基础上设计了一种基于MATLAB GUI技术的语音情感识别系统。实验结果表明这种新的改进特征能有效改善情感识别时出现的分类模糊化情况,基于此改进特征的语音情感系统能广泛地识别出噪声干扰下的说话人情感。  相似文献   

15.
基于音素的发音质量评价算法   总被引:6,自引:0,他引:6  
面对广大的外语学习者,计算机辅助语言学习系统已经成为一种最佳的口语学习方式。该文提出了一种新的应用于计算机辅助语言学习系统的面向英语学习人群的发音质量评价算法,名为PASS(phone-basedautomaticscoreforl2speechquality)。PASS算法以基于隐含Markov模型的语音识别和口音自适应技术为基础,考察了音素发音的准确性和流利性信息,定义了音素级的发音质量分数,从而可以综合得到整句的评分结果。在实验室自行采集和精细标注的非母语语音库上与其他评分算法进行比较实验,PASS与专家评分的句子级相关性达到了0.66,优于其他算法。目前PASS算法已经被成功地应用于清华大学出版社的互动式语言学习系统中。  相似文献   

16.
说话人特征提取是说话人识别系统中的关键环节,优良的特征提取算法既能有效反映说话人的基本特征,又能为识别的有效性提供保证.根据量子势阱理论,论文以透射系数、能量和频率的对应关系为切入点,构造出使频率和势阱一一对应的势阱组.针对语音信号的特点,将一帧语音信号视为一个量子态,利用势阱分离能量的特性,通过势阱组提取出信号的能量谱特征,并以此作为特征参数,探索了一种基于量子势垒组的说话人特征提取方法.仿真结果表明,在相同条件下,该方法可以降低算法的复杂性并能够有效的提取说话人特征,为说话人特征提取提供了新的研究方向.  相似文献   

17.
管制指令特征参数提取研究   总被引:2,自引:1,他引:1  
在管制指令语音识别系统的研究中,语音的特征参数提取方法是影响系统识别率的关键因素之一。在Matlab平台上基于MATLAB GUI技术,设计完成HMM语音训练识别模型的用户操作界面,实现特征参数提取方法的选择、语音信号的训练、识别操作及结果输出和波形显示。通过实例对比分析,特定人和非特定人情况下,LPCC和MFCC两种特征参数提取方法在训练、识别时间和识别率上的差异。结果表明,特定人时LPCC参数的识别优势明显;非特定人时,MFCC参数的识别效果和效率更好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号