期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

方凡泉李心广王桂珍林江豪《广州大学学报(自然科学版)》2011,10(1):65-69

语音质量的客观评价在语言自主学习中具有重大的意义.文章首先介绍了语音质量客观评价过程中语音信号的预处理单元;其次,介绍了不同的语音特征提取算法,比较选择了更符合人耳听觉模型的MFCC特征,并给出特征提取过程及结果;最后,比较当前评价模型(DTW和HMM)的优缺点,并提出了采用HMM模型进行评价的方法,设计系统验证了该方... 相似文献

2.

基于语音合成法的汉语人名语音库的设计应用

王秀君和应民《应用科技》2006,33(3):10-12

采用语音合成方法完成了汉语人名语音库的设计.声母部分直接采用录音样本,而韵母部分则通过激励声道频率响应函数来合成语音,然后通过声韵母拼接来实现人名语音合成,以此建立人名语音库.可以实现各种可能人名语音的合成,适合应用于多种电子自助系统中. 相似文献

3.

一种改进的基于Gabor变换的字符特征提取方法

《科技信息》2008,(18)

当前应用广泛的光学字符识别(OCR),通常都严重依赖于对图像中灰度信息特征的选自与提取。本文针对汉字字符特征提取,提出一种基于Gabor变换的字符特征提取方法。本方法首先对图像进行归一化处理,再对归一化图像利用Gabor变换计算笔划方向特征,以该特征作为字符的基本特征或者基本特征之一。实验证明该方法提取到的特征对于易混淆的字符和脱机手写字符均具有较好的分类效果。相似文献

4.

基于改进线性预测基音频率的语音情感识别系统

汪兰兰蔡昌新《科学技术与工程》2022,22(26):11524-11532

针对目前常见的语音特征提取方法应用于真实环境中,所提取的语音特征包含有噪声干扰的问题,进而导致情感识别时出现的分类模糊化情况,为此提出一种新的语音特征提取方法,即线性预测基音频率特征提取方法。它主要是基于线性预测系数来构建模型,利用构建的模型消除声道响应信息以及抑制噪声干扰。由于此方法对于分类模糊化问题没有得到较好改善,利用模型相同的LPCMCC(LPC Mel cepstral coefficients,LPC美尔倒频谱系数)来对线性预测基音频率进行改进,并设计基于线性预测基音频率、其改进特征、LPCMCC与SVM(support vector machines,支持向量机)的语音情感识别对比实验。对比实验表明,此改进特征提取方法应用在情感识别领域的平均精度最高为84%,比线性预测基音频率和LPCMCC要高出22%、14%。为了测试此改进特征在真实环境中的分类效果,在此改进特征的基础上设计了一种基于MATLAB GUI技术的语音情感识别系统。实验结果表明这种新的改进特征能有效改善情感识别时出现的分类模糊化情况,基于此改进特征的语音情感系统能广泛地识别出噪声干扰下的说话人情感。相似文献

5.

基于深度信念网络的语音情感识别

张丽吕军强彦刘继华《太原理工大学学报》2019,(1)

针对语音情感识别中的特征提取问题,通过多层深度信念网络(DBN)自动提取语音信号中的情感特征,把连续多帧的语音拼接在一起,形成一个高维抽象特征,将深度信念网络训练好的特征作为极限学习机(ELM)分类器的输入端,最终建立一个语音情感识别系统。实验结果表明,在CASIA情感语音数据库中,本方法优于其他情感识别方法。相似文献

6.

采用长短时记忆网络的低资源语音识别方法

《西安交通大学学报》2017,(10)

针对低资源环境下由于标注训练数据不足、造成语音识别系统识别率急剧下降的问题,提出一种采用长短时记忆网络的低资源语音识别(LSTM-LRASR)方法。该方法采用长短时记忆网络构建声学模型,从特征提取、数据扩展及模型优化3个方面提高低资源语音识别性能。在特征提取方面,提取语言无关的高层稳健特征参数,降低声学模型对训练数据的依赖;在数据扩展方面,对已有标注数据进行语速扰动,对无标注数据进行自动识别,从而自动获取更多标注数据;在模型优化方面,通过序贯区分性训练技术提高模型对易混淆音素的区分能力,利用最小风险贝叶斯解码对多个系统进行融合,进一步提高识别性能。对OpenKWS16评测数据的实验结果表明,采用LSTMLRASR方法搭建的低资源语音识别系统的词错率相对基线系统下降了29.9%,所有查询词的查询项权重代价提升了60.3%。相似文献

7.

南昌县（塘南）方言语音系统 总被引：1，自引：0，他引：1

肖放亮《江西科技师范学院学报》2010,(2):39-42

南昌县(塘南)方青是南昌方言的一种次方言[1].塘南方言的语音系统,由19个声母、62个韵母、7个声调构成.本文从声母、韵母、声调角度探究及展现出塘南方言独特的语音特征.同时,塘南方言与南昌方言城里话在语音方面之间也存在着一些明显差异.文章显现出塘南方言的独特个性,构建了塘南方言语音系统,丰富了南昌方言语音的深度研究. 相似文献

8.

基于BPNN/HMM神经网络的声学模型研究 总被引：1，自引：0，他引：1

李凡吴军黄刚《华中科技大学学报(自然科学版)》2004,32(9):9-11

研制了一种基于BP神经网络和隐马尔可夫模型(HMM)的混合声学模型,BP神经网络的主要功能是把失真语音特征矢量转换成纯净语音特征矢量,而删则对转换后的纯净语音特征矢量进行分类,从模型级补偿的方面来提高语音识别系统的鲁棒性．讨论了一种基于线性预测的MKCC语音特征提取方法,该方法把提取出的失真语音特征矢量作为神经网络的输入,从而实现了特征参数级去噪处理的目的．相似文献

9.

矢量量化技术和隐马尔柯夫模型方法在韵母识别中的应用 总被引：2，自引：0，他引：2

吴建雄陈础坚《上海交通大学学报》1991,25(5):35-42

本文应用矢量量化技术(Vector Quantization)和隐马尔柯夫模型方法(Hidden Markov Model)为一个全字汇量的孤立字普通话语音识别系统设计了韵母识别子系统.该系统由韵母信号析取器、滤波器阵列特征分析器、矢量量化器、预识别器、隐马尔柯夫模型匹配器和决策器组成.根据对汉语中1172个不同音节的语音信号测试结果,决策器输出的准确率(即系统的最后识别准确率)为89.5%,而前两个估计的识别准确率则达到97.2%.系统的训练包括生成矢量量化器的码字和为每一个韵母建立隐马尔柯夫模型,改进了Linde 等人提出的码字生成算法,提出了一个得到隐马尔柯夫模型参数的系统化方法. 相似文献

10.

基于非线性共振的说话人特征提取研究与仿真 总被引：1，自引：1，他引：0

何朝霞潘平《科学技术与工程》2012,12(25):6507-6510

针对人发声系统的非线性特性和语音信号的类混沌特性,提出了一种基于非线性共振Duffing模型的说话人语音信号的特征提取方法。实验结果表明:采用非线性共振Duffing模型的特征提取方法,较基于非线性动力学提取广义维数特征具有较高的识别率。同时,同一语音信号在相同的识别系统中,与经典的MFCC特征相比,也具有较高的识别率。相似文献

11.

维吾尔语语音识别中发音变异现象

杨雅婷马博王磊吐尔洪·吾司曼李晓《清华大学学报(自然科学版)》2011,(9):1230-1233,1238

维语口语发音中很多音素相对标准语产生了发音变异,基于标准语音的识别系统在识别带有发音变异的口语语料时识别率较低。该文针对维吾尔语同化、弱化、脱落、元音和谐等语流音变难点进行分析,对语音、韵律特性进行知识融合与技术创新,运用基于数据驱动和基于专家经验相结合的方法对维吾尔语方言口语中存在的发音变异现象进行研究,统计元音、辅音多发音变化映射对,建立音素混淆矩阵,为维吾尔语方言口语语音识别研究奠定基础。相似文献

12.

中文连续语音识别系统音素建模单元集的构建

包叶波胡郁刘聪江辉戴礼荣刘庆峰《清华大学学报(自然科学版)》2011,(9):1288-1292,1297

在识别系统中,建模单元能够勾画一种语言的声学和语音学特性,因此对系统性能起到至关重要的作用。该文参照一些已在大词汇量连续语音识别系统(LVCSR)中取得较好效果的建模单元集,构建了新的音素建模单元集(Ne-wPS)。另外,根据NewPS中元音及其变体对前后接音素协同发音的影响,提出了基于扩展的元音三角图设计问题集(NewQS)的方法。实验表明:NewPS和NewQS结合的识别性能超越了传统的声韵母建模单元集;并且,建模单元数目大幅度的减少给系统后续模块的处理带来了便利。相似文献

13.

基于DTW的俄语短指令语音识别

王彤马延周易绵竹《山东大学学报(理学版)》2017,52(11):29-36

面向训练语料有限的语音识别任务,基于动态时间规整(dynamic time warping, DTW)算法对俄语语音进行识别。首先,以跨语言标注的语音语料为资源基础,研究融合音字转换和机器翻译的语音识别方法。其次,结合俄语语音特点,以元音为中心设置动态门限阈值,实现精确至音节的端点检测,识别速度提高了34.4%,准确率提高了14%。然后,综合时域、频域分析,提取反映语音静态特征和动态变化的参数模板。另外,引入全局限制和早弃策略改进DTW算法,避免病态匹配,缩小计算规模,使速度提高了19.7%,准确率提高了4.8%。在俄语短指令语音集上做五折交叉验证,识别准确率达到74.9%。相似文献

14.

基于小波分析的梅尔频率倒谱参数? 总被引：1，自引：0，他引：1

董丽娜何怡叶卫平《北京师范大学学报(自然科学版)》2015,(5):469-474

采用HMM模型和MFCC参数的语音识别器对普通话中声母音素的区分度不够理想,而在基于识别的计算机辅助发音教学系统中的辅音的识别具有特别重要的意义.考虑到相同发音位置不同发音方式的声母音素变化较快且高频信息较多,本文将小波分析的方法引入到提取梅尔频率倒谱参数(MFCC)的过程当中,来提高信号高频部分的时域分辨率,提出了基于小波分析的梅尔倒谱参数MFCC_Wavelet.结合高低频不同分帧方式的MFCC_Wavelet参数与HMM模型的语音识别器,本文测试了MFCC和MFCC_Wavelet两种参数在4类发音中的区分性,实验结果表明,在相同发音位置不同发音方式、塞音与不塞音、送气音与不送气音及擦音与不擦音4类发音错误中,MFCC_Wavelet的总体效果好于MFCC. 相似文献

15.

Feedforward Control of a 3-D Physiological Articulatory Model for Vowel Production

方强 Akikazu Nishikido 《清华大学学报》2009,14(5):617-622

A three-dimensional (3-D) physiological articulatory model was developed to account for the biomechanical properties of the speech organs in speech production. Control of the model to investigate the mechanism of speech production requires an efficient control module to estimate muscle activation patterns, which is used to manipulate the 3-D physiological articulatory model, according to the desired articulatory posture. For this purpose, a feedforward control strategy was developed by mapping the articulatory target to the corresponding muscle activation pattern via the intrinsic representation of vowel articulation. In this process, the articulatory postures are first mapped to the corresponding intrinsic representations; then, the articulatory postures are clustered in the intrinsic representations space and a nonlinear function is approximated for each cluster to map the intrinsic representation of vowel articulation to the muscle activation pattern by using general regression neural networks (GRNN). The results show that the feedforward control module is able to manipulate the 3-D physiological articulatory model for vowel production with high accuracy both acoustically and articulatorily. 相似文献

16.

基于韵律信息的语种辨识系统

下载免费PDF全文

侯丽敏缪炜《上海大学学报(自然科学版)》2009,15(5):441-444

提出利用超声层次上的韵律信息来进行语种辨识.在子词分割的基础上结合元音/辅音检测模型,将语音分割为CⁿV的假音节模型,然后对每个假音节提取一个五维的特征韵律参数.分割结果比传统的分割方法更接近实际的音节结构.在韵律系统中,对所有的语言建立高斯混合模型(GMM),研究模型的离散度和模型间的干扰程度.实验表明,韵律模型对不同的语言、不同的语系和同一语系中不同语言均具有一定的区分效果. 相似文献

17.

英语易混辞格语用功能对比研究

黄衡田《上饶师范学院学报》2002,22(2):110-112

本文从语用学观点出发，对英语易混辞格的语用功能进行了对比研究，概述了这些辞格之间的异同点，这对正确理解作者或演讲者的意图，对严格区别和准确运用这些辞格大有裨益。相似文献

18.

一类基于概率神经网络的语音识别模型

荣蓉《山东理工大学学报：自然科学版》2005,19(3):49-52

介绍了采用人工神经网络,特别是概率神经网络(PNN)技术进行语音识别的原理．提出了一类基于概率神经网络的解决元音识别问题的模型,并且通过一个试验,研究了用于语音识别的PNN模型中的参数设置．试验表明,该模型对于元音的识别具有较好的识别率．相似文献

19.

说话人识别中改进的MFCC参数提取方法 总被引：1，自引：0，他引：1

何朝霞《科学技术与工程》2011,18(18):4215-4218,4227

在说话人识别技术中,特征参数的提取对语音训练和识别有着非常重要的作用。而Mel频标倒谱系数MFCC是一种常用的特征,它能对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。同时由于语音信号具有时变和混沌特性,以非线性随机共振理论和人类对听觉的理解为基础,提出了一种基于随机共振的MFCC特征参数提取方法。通过实验比较两种方法的结果,论证了改进方法的可行性以及优越性,为说话人识别技术中特征参数提取提供了一条新的研究方向。相似文献

20.

语音增强用于抗噪声语音识别 总被引：12，自引：1，他引：11

徐义芳张金杰姚开盛曹志刚王勇前《清华大学学报(自然科学版)》2001,41(1):41-44

语音识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的 ,则语音识别系统可以令人满意地工作。然而 ,当实际环境中有噪声存在时 ,语音识别系统性能急剧下降。为了让语音识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能 ,研究了一个将语音增强器和语音识别器级连起来的系统。该系统中 ,语音增强作为前端处理用于提高识别器输入端信号的信噪比。通过 3种不同的增强算法用于纯净语音和3种类型带噪语音的实验结果分析比较表明 ,这一方法对纯净语音的识别精度几乎没有任何改变而大大提高了系统的抗噪声性能相似文献