首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
语音质量的客观评价在语言自主学习中具有重大的意义.文章首先介绍了语音质量客观评价过程中语音信号的预处理单元;其次,介绍了不同的语音特征提取算法,比较选择了更符合人耳听觉模型的MFCC特征,并给出特征提取过程及结果;最后,比较当前评价模型(DTW和HMM)的优缺点,并提出了采用HMM模型进行评价的方法,设计系统验证了该方...  相似文献   

2.
采用语音合成方法完成了汉语人名语音库的设计.声母部分直接采用录音样本,而韵母部分则通过激励声道频率响应函数来合成语音,然后通过声韵母拼接来实现人名语音合成,以此建立人名语音库.可以实现各种可能人名语音的合成,适合应用于多种电子自助系统中.  相似文献   

3.
当前应用广泛的光学字符识别(OCR),通常都严重依赖于对图像中灰度信息特征的选自与提取。本文针对汉字字符特征提取,提出一种基于Gabor变换的字符特征提取方法。本方法首先对图像进行归一化处理,再对归一化图像利用Gabor变换计算笔划方向特征,以该特征作为字符的基本特征或者基本特征之一。实验证明该方法提取到的特征对于易混淆的字符和脱机手写字符均具有较好的分类效果。  相似文献   

4.
汪兰兰  蔡昌新 《科学技术与工程》2022,22(26):11524-11532
针对目前常见的语音特征提取方法应用于真实环境中,所提取的语音特征包含有噪声干扰的问题,进而导致情感识别时出现的分类模糊化情况,为此提出一种新的语音特征提取方法,即线性预测基音频率特征提取方法。它主要是基于线性预测系数来构建模型,利用构建的模型消除声道响应信息以及抑制噪声干扰。由于此方法对于分类模糊化问题没有得到较好改善,利用模型相同的LPCMCC(LPC Mel cepstral coefficients,LPC美尔倒频谱系数)来对线性预测基音频率进行改进,并设计基于线性预测基音频率、其改进特征、LPCMCC与SVM(support vector machines,支持向量机)的语音情感识别对比实验。对比实验表明,此改进特征提取方法应用在情感识别领域的平均精度最高为84%,比线性预测基音频率和LPCMCC要高出22%、14%。为了测试此改进特征在真实环境中的分类效果,在此改进特征的基础上设计了一种基于MATLAB GUI技术的语音情感识别系统。实验结果表明这种新的改进特征能有效改善情感识别时出现的分类模糊化情况,基于此改进特征的语音情感系统能广泛地识别出噪声干扰下的说话人情感。  相似文献   

5.
针对语音情感识别中的特征提取问题,通过多层深度信念网络(DBN)自动提取语音信号中的情感特征,把连续多帧的语音拼接在一起,形成一个高维抽象特征,将深度信念网络训练好的特征作为极限学习机(ELM)分类器的输入端,最终建立一个语音情感识别系统。实验结果表明,在CASIA情感语音数据库中,本方法优于其他情感识别方法。  相似文献   

6.
针对低资源环境下由于标注训练数据不足、造成语音识别系统识别率急剧下降的问题,提出一种采用长短时记忆网络的低资源语音识别(LSTM-LRASR)方法。该方法采用长短时记忆网络构建声学模型,从特征提取、数据扩展及模型优化3个方面提高低资源语音识别性能。在特征提取方面,提取语言无关的高层稳健特征参数,降低声学模型对训练数据的依赖;在数据扩展方面,对已有标注数据进行语速扰动,对无标注数据进行自动识别,从而自动获取更多标注数据;在模型优化方面,通过序贯区分性训练技术提高模型对易混淆音素的区分能力,利用最小风险贝叶斯解码对多个系统进行融合,进一步提高识别性能。对OpenKWS16评测数据的实验结果表明,采用LSTMLRASR方法搭建的低资源语音识别系统的词错率相对基线系统下降了29.9%,所有查询词的查询项权重代价提升了60.3%。  相似文献   

7.
南昌县(塘南)方言语音系统   总被引:1,自引:0,他引:1  
南昌县(塘南)方青是南昌方言的一种次方言[1].塘南方言的语音系统,由19个声母、62个韵母、7个声调构成.本文从声母、韵母、声调角度探究及展现出塘南方言独特的语音特征.同时,塘南方言与南昌方言城里话在语音方面之间也存在着一些明显差异.文章显现出塘南方言的独特个性,构建了塘南方言语音系统,丰富了南昌方言语音的深度研究.  相似文献   

8.
基于BPNN/HMM神经网络的声学模型研究   总被引:1,自引:0,他引:1  
研制了一种基于BP神经网络和隐马尔可夫模型(HMM)的混合声学模型,BP神经网络的主要功能是把失真语音特征矢量转换成纯净语音特征矢量,而删则对转换后的纯净语音特征矢量进行分类,从模型级补偿的方面来提高语音识别系统的鲁棒性.讨论了一种基于线性预测的MKCC语音特征提取方法,该方法把提取出的失真语音特征矢量作为神经网络的输入,从而实现了特征参数级去噪处理的目的.  相似文献   

9.
矢量量化技术和隐马尔柯夫模型方法在韵母识别中的应用   总被引:2,自引:0,他引:2  
本文应用矢量量化技术(Vector Quantization)和隐马尔柯夫模型方法(Hidden Markov Model)为一个全字汇量的孤立字普通话语音识别系统设计了韵母识别子系统.该系统由韵母信号析取器、滤波器阵列特征分析器、矢量量化器、预识别器、隐马尔柯夫模型匹配器和决策器组成.根据对汉语中1172个不同音节的语音信号测试结果,决策器输出的准确率(即系统的最后识别准确率)为89.5%,而前两个估计的识别准确率则达到97.2%.系统的训练包括生成矢量量化器的码字和为每一个韵母建立隐马尔柯夫模型,改进了Linde 等人提出的码字生成算法,提出了一个得到隐马尔柯夫模型参数的系统化方法.  相似文献   

10.
基于非线性共振的说话人特征提取研究与仿真   总被引:1,自引:1,他引:0  
何朝霞  潘平 《科学技术与工程》2012,12(25):6507-6510
针对人发声系统的非线性特性和语音信号的类混沌特性,提出了一种基于非线性共振Duffing模型的说话人语音信号的特征提取方法。实验结果表明:采用非线性共振Duffing模型的特征提取方法,较基于非线性动力学提取广义维数特征具有较高的识别率。同时,同一语音信号在相同的识别系统中,与经典的MFCC特征相比,也具有较高的识别率。  相似文献   

11.
维语口语发音中很多音素相对标准语产生了发音变异,基于标准语音的识别系统在识别带有发音变异的口语语料时识别率较低。该文针对维吾尔语同化、弱化、脱落、元音和谐等语流音变难点进行分析,对语音、韵律特性进行知识融合与技术创新,运用基于数据驱动和基于专家经验相结合的方法对维吾尔语方言口语中存在的发音变异现象进行研究,统计元音、辅音多发音变化映射对,建立音素混淆矩阵,为维吾尔语方言口语语音识别研究奠定基础。  相似文献   

12.
在识别系统中,建模单元能够勾画一种语言的声学和语音学特性,因此对系统性能起到至关重要的作用。该文参照一些已在大词汇量连续语音识别系统(LVCSR)中取得较好效果的建模单元集,构建了新的音素建模单元集(Ne-wPS)。另外,根据NewPS中元音及其变体对前后接音素协同发音的影响,提出了基于扩展的元音三角图设计问题集(NewQS)的方法。实验表明:NewPS和NewQS结合的识别性能超越了传统的声韵母建模单元集;并且,建模单元数目大幅度的减少给系统后续模块的处理带来了便利。  相似文献   

13.
面向训练语料有限的语音识别任务,基于动态时间规整(dynamic time warping, DTW)算法对俄语语音进行识别。首先,以跨语言标注的语音语料为资源基础,研究融合音字转换和机器翻译的语音识别方法。其次,结合俄语语音特点,以元音为中心设置动态门限阈值,实现精确至音节的端点检测,识别速度提高了34.4%,准确率提高了14%。然后,综合时域、频域分析,提取反映语音静态特征和动态变化的参数模板。另外,引入全局限制和早弃策略改进DTW算法,避免病态匹配,缩小计算规模,使速度提高了19.7%,准确率提高了4.8%。在俄语短指令语音集上做五折交叉验证,识别准确率达到74.9%。  相似文献   

14.
基于小波分析的梅尔频率倒谱参数?   总被引:1,自引:0,他引:1  
采用HMM模型和MFCC参数的语音识别器对普通话中声母音素的区分度不够理想,而在基于识别的计算机辅助发音教学系统中的辅音的识别具有特别重要的意义.考虑到相同发音位置不同发音方式的声母音素变化较快且高频信息较多,本文将小波分析的方法引入到提取梅尔频率倒谱参数(MFCC)的过程当中,来提高信号高频部分的时域分辨率,提出了基于小波分析的梅尔倒谱参数MFCC_Wavelet.结合高低频不同分帧方式的MFCC_Wavelet参数与HMM模型的语音识别器,本文测试了MFCC和MFCC_Wavelet两种参数在4类发音中的区分性,实验结果表明,在相同发音位置不同发音方式、塞音与不塞音、送气音与不送气音及擦音与不擦音4类发音错误中,MFCC_Wavelet的总体效果好于MFCC.  相似文献   

15.
A three-dimensional (3-D) physiological articulatory model was developed to account for the biomechanical properties of the speech organs in speech production. Control of the model to investigate the mechanism of speech production requires an efficient control module to estimate muscle activation patterns, which is used to manipulate the 3-D physiological articulatory model, according to the desired articulatory posture. For this purpose, a feedforward control strategy was developed by mapping the articulatory target to the corresponding muscle activation pattern via the intrinsic representation of vowel articulation. In this process, the articulatory postures are first mapped to the corresponding intrinsic representations; then, the articulatory postures are clustered in the intrinsic representations space and a nonlinear function is approximated for each cluster to map the intrinsic representation of vowel articulation to the muscle activation pattern by using general regression neural networks (GRNN). The results show that the feedforward control module is able to manipulate the 3-D physiological articulatory model for vowel production with high accuracy both acoustically and articulatorily.  相似文献   

16.
提出利用超声层次上的韵律信息来进行语种辨识.在子词分割的基础上结合元音/辅音检测模型,将语音分割为CnV的假音节模型,然后对每个假音节提取一个五维的特征韵律参数.分割结果比传统的分割方法更接近实际的音节结构.在韵律系统中,对所有的语言建立高斯混合模型(GMM),研究模型的离散度和模型间的干扰程度.实验表明,韵律模型对不同的语言、不同的语系和同一语系中不同语言均具有一定的区分效果.  相似文献   

17.
本文从语用学观点出发,对英语易混辞格的语用功能进行了对比研究,概述了这些辞格之间的异同点,这对正确理解作者或演讲者的意图,对严格区别和准确运用这些辞格大有裨益。  相似文献   

18.
介绍了采用人工神经网络,特别是概率神经网络(PNN)技术进行语音识别的原理.提出了一类基于概率神经网络的解决元音识别问题的模型,并且通过一个试验,研究了用于语音识别的PNN模型中的参数设置.试验表明,该模型对于元音的识别具有较好的识别率.  相似文献   

19.
说话人识别中改进的MFCC参数提取方法   总被引:1,自引:0,他引:1  
何朝霞 《科学技术与工程》2011,18(18):4215-4218,4227
在说话人识别技术中,特征参数的提取对语音训练和识别有着非常重要的作用。而Mel频标倒谱系数MFCC是一种常用的特征,它能对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。同时由于语音信号具有时变和混沌特性,以非线性随机共振理论和人类对听觉的理解为基础,提出了一种基于随机共振的MFCC特征参数提取方法。通过实验比较两种方法的结果,论证了改进方法的可行性以及优越性,为说话人识别技术中特征参数提取提供了一条新的研究方向。  相似文献   

20.
语音增强用于抗噪声语音识别   总被引:12,自引:1,他引:11  
语音识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的 ,则语音识别系统可以令人满意地工作。然而 ,当实际环境中有噪声存在时 ,语音识别系统性能急剧下降。为了让语音识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能 ,研究了一个将语音增强器和语音识别器级连起来的系统。该系统中 ,语音增强作为前端处理用于提高识别器输入端信号的信噪比。通过 3种不同的增强算法用于纯净语音和3种类型带噪语音的实验结果分析比较表明 ,这一方法对纯净语音的识别精度几乎没有任何改变而大大提高了系统的抗噪声性能  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号