期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

曹辉徐晨赵晓吴胜举《西北大学学报(自然科学版)》2013,(2):203-208

目的研究语音特征梅尔频率倒谱系数(MFCC)的选取对说话人识别系统性能的影响。方法采用基于平均影响值(MIV)的支持向量机(SVM)方法研究了说话人识别中的梅尔频率倒谱系数各维倒谱分量对于识别分类的贡献度。结果选择具有代表性的特征向量进行说话人分类识别,能得到维数更低、识别率更高的特征参数。结论通过MIV值可判断各维特征参数分量的重要性,选取权重值高的MFCC特征参数来提高系统识别率和缩短系统运行时间。相似文献

2.

基于改进MFCC的说话人特征参数提取算法

高铭孙仁诚《青岛大学学报(自然科学版)》2019,(1)

在说话人识别系统中,传统梅尔倒频谱系数(MFCC)所提取特征不能够很好的反映说话人动态特征,尤其在噪声环境中,识别率较低,鲁棒性不足。针对以上问题,提出一种基于改进梅尔倒频谱系数(MFCC)的方法,通过多窗谱估计和一阶、二阶差分的方法提升识别性能。实验结果证明,在纯净语音和添加信噪的情况下,改进后方法的识别准确率都有所提升。当训练集为纯净语音,只为测试集添加噪声时,实验结果依然有较高的准确率。相似文献

3.

基于统计阈值的鲁棒性语音识别(英文)

李银国蒲甫安郑方《重庆邮电学院学报(自然科学版)》2012,(2)

近几十年来,语音识别系统已由实验室环境走向真实的世界中。在不同的环境噪声下,识别性能却仍不尽人意,尤其是在低信噪比的环境中。为解决在低信噪比情况下的低识别率的问题,以声学参数MFCC(Mel-frequency cepstrum coefficient)为基础,提出了一种基于统计阈值的倒谱均值方差归一化算法,该算法能进一步减小训练环境和测试环境的不匹配程度,从而提升了语音识别系统对环境噪声的鲁棒性。首先,对输入的语音提取MFCC声学参数,然后对提取的声学参数作均值方差归一化处理,最后采用统计阈值的方法抑制归一化后存在变异的特征。该算法能增加带噪语音特征和纯净语音特征的相似性;与MFCC为基线的系统相比,在低信噪比情况下,该算法的错误率最高下降约40%,同时该方法也优于其他的鲁棒性特征倒谱均值减和倒谱均值归一。相似文献

4.

基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法

张怡然白静王力《科学技术与工程》2014,(19)

语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行平滑处理,得到信号的谱包络。然后对信号的谱包络进行计算,得到改进的MFCC参数。实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上。相似文献

5.

噪声环境下语音识别的端点检测技术

李洪波于洪志《西北民族学院学报》2007,28(1):44-47

端点检测的准确性在某种程度上直接决定了整个语音识别系统的成败,没有足够准确的端点检测(尤其是起点),精密优选特征类型或识别方法的工作往往劳而无功.噪声环境下语音识别的端点检测技术利用语音信号的倒谱特征作为判决抽样信号帧是否为语音信号的依据,并提出了倒谱距离测量法、基于隐马尔柯夫模型(HMM)的检测法.通过对两种宽带噪声(白噪声和汽车噪声)环境下信噪比从0dB到15dB的带噪语音信号进行的仿真实验结果表明,发现倒谱特征参数的语音信号端点检测方法在噪声环境下具有更强的适应性,更适合于实际的语音处理系统. 相似文献

6.

基于梅尔频率倒谱系数与短时能量的低信噪比语音端点检测

《南京师大学报(自然科学版)》2021,(2)

低信噪比环境下语音信号的端点检测在语音识别与通信等领域具有重要意义,目前低信噪比环境下的端点检测还存在效率低、识别率不高等问题.本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相加(MFCC_a),再与短时能量相除(梅尔能量比)作为语音特征参数的语音端点检测测度,最后利用模糊C均值聚类算法自适应确定双门限阈值进行端点检测.选取TIMIT语音库中的50条语音信号进行实验,结果表明:在信噪比为5 dB、0 dB、-5 dB的噪声环境下,与能零比、谱熵等算法相比,本算法端点识别准确率均有所提高,其中在-5 dB信噪比环境下提升了约30%. 相似文献

7.

基于修正MFCC参数汉语耳语音的话者识别 总被引：12，自引：1，他引：12

林玮杨莉莉徐柏龄《南京大学学报(自然科学版)》2006,42(1):54-62

耳语音的话者识别是一个较新的研究课题,许多参数模型与正常音存在差异.例如话者识别中常见的M el倒谱系数(MFCC)应用于耳语音中就存在共振峰和听觉敏感区域定位的偏差.基于对耳语音共振峰位置、能量以及人耳对耳语音听觉模型的研究提出了修正MFCC参数MFCCM和MFCCExp-Log,并结合两种参数的特点,改进了传统隐马尔可夫模型,建立了适用于耳语音的汉语话者识别系统.通过1 600个音的话者识别实验得出采用MFCCM的正确率为88.88%;MFCCExp-Log参数为91.38%;如果采用改进隐马尔可夫模型正确率可以提高到92.31%,均高于传统参数模型.实验表明,修正MFCC参数可以作为表征耳语音特点的参数,它提高了耳语音话者识别系统的识别率. 相似文献

8.

基于小波-倒频谱技术的语音识别研究

Ye Hua 《科技信息》2008,(17)

在实际应用中,噪声干扰导致语音识别性能急剧下降。针对该问题,本文分析传统方法并提出相应的系统解决方案:采用小波变换对语音信号进行前端处理,以MFCC声道特征结合基频(F0)韵律特征来提高识别系统的鲁棒性。实验结果表明:小波变换能有效地消除噪声影响,经小波降噪处理后,使得F0-MFCC联合模型能更好的识别语音。可以看出在噪声环境下系统的综合性能得到很大改善。相似文献

9.

汽车噪声中自动语音的识别技术 总被引：5，自引：0，他引：5

韦晓东胡光锐《上海交通大学学报》1998,32(10):10-13

汽车中的话音拨号系统是自动语音识别技术的应用热点．自动语音识别系统是一个基于训练的系统．在汽车噪声中,由于实际应用环境与形成系统参数的训练环境的失配,传统语音识别系统的性能会大幅度地下降,从而无法实用．为了提高语音识别系统在特定环境下的识别率及实用性,首先根据汽车环境中语音的失真模型分析了系统性能下降的原因,然后针对加性汽车噪声与信道失真对系统的影响,讨论了在汽车噪声中改善语音识别系统性能的方法．提出了在识别系统中用基于子带的语音增强算法和倒谱均值相减算法相结合的方法．对大量的多人连续数字串语音的识别实验表明,这一方法大大提高了系统在汽车噪声环境中的识别率,它还可以简便、实时的实现,具有一定的实用性．相似文献

10.

基于MFCC特征组合参数的说话人识别研究

曾霞霞徐戈吴征远《集美大学学报(自然科学版)》2016,(4):317-320

为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数（MFCC）与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。相似文献

11.

应用倒谱特征的带噪语音端点检测方法 总被引：7，自引：0，他引：7

韦晓东胡光锐任晓林《上海交通大学学报》2000,34(2):185-188

传统的语音端点检测方法以信号的短时能量、过零率等简单特征为判决特征参数。这些方法在实际应用中,尤其当信号噪比比较低时,无法满足系统的需要。文中利用语音信号的倒谱特征作为判决抽样信号帧是否为语音信号的依据,并提出了倒谱距离测量法和循环神经网络法,通过对宽带噪声－白噪声干扰情况和一种特殊噪声－汽车噪声情况的实验,发现倒谱特征参数的语音信号端点检测方法在噪声环境下具有传统的能量方法无法比拟的优越性,更适相似文献

12.

Improved MFCC-Based Feature for Robust Speaker Identification 总被引：2，自引：0，他引：2

吴尊敬曹志刚《清华大学学报》2005,10(2):158-161

The Mel-frequency cepstral coefficient (MFCC) is the most widely used feature in speech and speaker recognition. However, MFCC is very sensitive to noise interference, which tends to drastically degrade the performance of recognition systems because of the mismatches between training and testing. In this paper, the logarithmic transformation in the standard MFCC analysis is replaced by a combined function to improve the noisy sensitivity. The proposed feature extraction process is also combined with speech enhancement methods, such as spectral subtraction and median-filter to further suppress the noise. Experiments show that the proposed robust MFCC-based feature significantly reduces the recognition error rate over a wide signal-to-noise ratio range. 相似文献

13.

基于矢量泰勒级数的鲁棒语音识别

吕勇吴镇扬《天津大学学报(自然科学与工程技术版)》2011,44(3)

矢量泰勒级数是一种有效的抗噪声鲁棒语音识别算法.然而在对数谱域,美尔滤波器组的不同通道之间有较强的相关性,因而难以从含噪语音中准确估计噪声的方差.提出了一种基于矢量泰勒级数的倒谱域特征补偿算法.该算法在倒谱域,用一个高斯混合模型描述语音倒谱特征的分布,通过矢量泰勒级数从含噪语音中估计噪声的均值和方差.实验结果表明,此算法能明显提高语音识别系统的性能,优于基于矢量泰勒级数的对数谱域特征补偿算法. 相似文献

14.

一种基于噪声模型的语音/噪声分类方法

吴边任晓林刘重庆张亚昕《上海交通大学学报》2004,38(9):1528-1531

提出了一种可用于嵌入式ASR系统的语音/噪声分类的新方法，该方法利用一个噪声模型，对每帧信号的评价值进行语音/噪声分类．实验表明，该方法可以有效地区分语音和噪声，并表现出在各种噪声环境和不同信噪比条件下的鲁棒性．该算法已经集成进一个ASR系统，并在Corn-paq iPAQ上进行了测试，其计算代价不到整个系统代价的10％．相似文献

15.

基于改进线性预测基音频率的语音情感识别系统

汪兰兰蔡昌新《科学技术与工程》2022,22(26):11524-11532

针对目前常见的语音特征提取方法应用于真实环境中,所提取的语音特征包含有噪声干扰的问题,进而导致情感识别时出现的分类模糊化情况,为此提出一种新的语音特征提取方法,即线性预测基音频率特征提取方法。它主要是基于线性预测系数来构建模型,利用构建的模型消除声道响应信息以及抑制噪声干扰。由于此方法对于分类模糊化问题没有得到较好改善,利用模型相同的LPCMCC(LPC Mel cepstral coefficients,LPC美尔倒频谱系数)来对线性预测基音频率进行改进,并设计基于线性预测基音频率、其改进特征、LPCMCC与SVM(support vector machines,支持向量机)的语音情感识别对比实验。对比实验表明,此改进特征提取方法应用在情感识别领域的平均精度最高为84%,比线性预测基音频率和LPCMCC要高出22%、14%。为了测试此改进特征在真实环境中的分类效果,在此改进特征的基础上设计了一种基于MATLAB GUI技术的语音情感识别系统。实验结果表明这种新的改进特征能有效改善情感识别时出现的分类模糊化情况,基于此改进特征的语音情感系统能广泛地识别出噪声干扰下的说话人情感。相似文献

16.

加性白噪声环境下语音特征参数鲁棒性的研究

孙林慧杨震《南京邮电大学学报(自然科学版)》2005,25(5):53-56

随着说话人识别技术的发展,实用有效的说话人识别系统越来越成为研究的重点。语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性。文中则主要在加性白噪声环境下研究M el倒谱参数、M el差分倒谱参数的顽健性以及它们经过倒谱系数零均值化(CMN)处理后识别性能的改进。从仿真结果可以看出:在加性白噪声环境下,差分倒谱参数具有很好的鲁棒性;倒谱系数零均值化能有效的除去加性白噪声。相似文献

17.

基于统计阈值的鲁棒性语音识别

李银国蒲甫安郑方 《重庆邮电大学学报(自然科学版)》2012,24(2):127-132

近几十年来,语音识别系统已由实验室环境走向真实的世界中.在不同的环境噪声下,识别性能却仍不尽人意,尤其是在低信噪比的环境中.为解决在低信噪比情况下的低识别率的问题,以声学参数MFCC( Mel-frequen-cy cepstrum coefficient)为基础,提出了一种基于统计阈值的倒谱均值方差归一化算法,该算法... 相似文献

18.

混响声场中语音识别方法研究 总被引：1，自引：4，他引：1

栗学丽徐柏龄《南京大学学报(自然科学版)》2003,39(4):525-531

免提式话筒语音识别系统是语音识别走向实用的目标之一．实现这一系统，首先要解决房间效应引起的混响问题．通过讨论室内混响声场中语音的特点，提出用鲁棒性特征参数——滤波规整的Mel频率倒谱参数(FNMFCC，即MFCC参数在对数功率谱域进行低通滤波，倒谱域进行均值减，并用标准差加权进行非线性规整，采用这3种措施来消除混响引起的语音参数的变化．识别方法用矢量量化法，用4组无混响数码语音进行训练，对特定人无混响和4种混响声场中共150组数码音的平均识别率达到98．7％．提出的这一新方法在不降低无混响音识别率的情况下，提高了混响声场的语音识别率．该方法不仅识别率高，而且运算量小、所需内存空间小。易于做成小型实用的快速识别系统．相似文献

19.

一种客观音质评价的新方法

吴淑珍 PoLS LCW 《北京大学学报(自然科学版)》1997,33(5):627-632

主要讨论了一种使用语音频谱动态特性的倒谱距离测量对通信系统或通信设备进行客观音质评价方法，它是在使用ＬＰＣ倒谱距离评价普通话语音质量的基础上发展起来的，语音频谱动态特性是利用倒谱对时间的回归分析来表示的，这种度量方法中，使用倒谱系数，倒谱回归系数和能量回归系数３个参数的距离测量，在使用了谱包络信息的基础上，考虑了谱包络随时间的变化量及信号能量随时间的变化，比较了４种距离估算方法和主观音质评价（ＭＯ相似文献