期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李昕李为游寒旭朱杰《上海师范大学学报(自然科学版)》2016,45(2):237-242

为解决文本无关说话人识别中训练与识别环境不同导致模式失配的问题,提出了一种采用语音增强模块进行前端预处理的i-向量说话人识别系统,从而提高系统对于环境噪声的鲁棒性.为评估不同语音增强算法的性能,利用NIST08核心测试集进行仿真实验.采用IMCRA算法对语音进行噪声估计后,分别用维纳滤波法、MMSE-LSA、传统谱减法和多频带谱减法等4种方法进行语音增强前端处理,在基于i-向量的说话人识别系统下进行实验.实验结果表明采用了语音增强的系统具有一定抗噪声性能,并且在高信噪比条件下,基于多频带的谱减法在此系统下性能最佳,而低信噪比情况下MMSE-LSA算法更有优势. 相似文献

2.

噪声环境下语音识别方法研究 总被引：5，自引：0，他引：5

吴淑珍冯成林黄新宇《北京大学学报(自然科学版)》2001,37(3):365-370

研究了6种噪声背景下与说话人有关的孤立词语音识别方法。它们是：线性预测误差法,单边自相关线性预测法,语音前端声学处理法,正则相关分析的谱变换补偿方法,特征综合法和同模极点增加法。实验结果表明,这6种方法都有效地提高了噪声环境中语音识别率,其中较好的方法在强噪声环境中(信噪比为0dB)的语音识别率达到80%以上,为信噪比较低的噪声环境中自动语音识别展现了美好前景。相似文献

3.

基于MFCC等组合特征的说话人识别模型

朱建伟孙水发刘晓丽《三峡大学学报(自然科学版)》2009,31(6):77-79,93

为了有效提取语音特征,提高说话人识别的准确率,系统采用基于有限状态机的端点检测算法对原始语音做VAD处理,提出了新的特征组合参数：基于人的听觉特性的MFCC参数、基于发音生理特征的基音轮廓特征以及衍生的基音周期一阶差分、基音周期变化率,并将它们作为说话人识别系统的特征参数,建立了基于VQ的识别模型.实验表明：本文系统使用VAD,使系统的识别率提高了5%8%,较单独使用MFCC参数的说话人识别系统的识别率提高了2%3%. 相似文献

4.

基于微信号增强的机器人远距离语音识别仿真

卢丽萌《辽宁大学学报(自然科学版)》2023,(1):38-44

由于噪声信号的干扰,导致机器人难以实现对微弱信号的远距离语音识别,影响最终的识别效果.为此,本文提出基于微信号增强的机器人远距离语音识别仿真研究.首先采用谱减法对微信号进行增强处理,由于语音信号中噪声功率谱具有一定的稳态属性,可估算出噪声的功率谱,再利用谱减计算求出纯净语音的功率谱,对傅里叶变换后的各个相位信号进行差异化赋权后,再对去噪功率谱进行拟合,完成对信号相位的恢复.在语音识别阶段,将增强后的原始语音信号分解为若干个独立的语音帧,在梅尔三角滤波器组中提取语音信号的Mel频谱参数,将其与语音频率之间的关系作为识别特征参数,最后利用梯度下降算法,在损失函数的约束下匹配与识别特征拟合度最高的内容,实现语音识别.仿真测试结果表明,本文提出的设计方法在噪声、不同信噪比、不同测试距离下对语音的识别率均达到了95.00%以上,与对照组相比具有更好的识别效果. 相似文献

5.

融合语音增强与后续补偿的抗噪声语音识别方法 总被引：2，自引：1，他引：2

丁沛曹志刚《清华大学学报(自然科学版)》2003,43(7):919-922

为了提高基于隐含Markov模型的语音识别系统在噪声环境中的稳健性,研究了一种融合语音增强与后续补偿的抗噪声语音识别方法.在前端,语音增强有效地抑制背景噪声,从而提高了输入信号的信噪比.语音增强后的剩余噪声以及语音失真是对语音识别不利的因素,其影响将通过识别阶段的并行模型合并或特征提取阶段的倒谱均值归一化得到补偿.实验结果表明,此方法能够显著地提高语音识别系统在噪声环境中,特别是低信噪比条件下的识别精度,如对-5 dB的自噪声,该方法可将识别精度从11.7%提高至71.0%. 相似文献

6.

基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法

张怡然白静王力《科学技术与工程》2014,(19)

语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行平滑处理,得到信号的谱包络。然后对信号的谱包络进行计算,得到改进的MFCC参数。实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上。相似文献

7.

基于多窗频谱估计和平滑幅度谱包络的MFCC改进算法 总被引：1，自引：0，他引：1

张怡然白静王力《科学技术与工程》2014,14(19)

语音的特征提取是说话人识别系统中的关键问题。本文在传统的MFCC参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行平滑处理,得到信号的谱包络。然后对信号的谱包络进行计算,得到改进的MFCC参数。实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上。相似文献

8.

噪声环境中基于DTW的说话人识别

张飞云张鹏高建生《许昌师专学报》2011,(5):68-72

在VC＋＋环境下,提取PLAR特征参数,基于听觉特性和语谱特性的语音增强器作为预处理器,对语音信号首先进行降噪处理,建立了基于DTW的抗噪声说话人识别系统．实验结果表明,即使在信噪比比较低的情况下,该系统都会在一定程度上提高多种噪声环境下说话人识剐系统的识别性能．相似文献

9.

基于调制域谱减法的鲁棒性说话人识别 总被引：1，自引：1，他引：0

程小伟王健曾庆宁谢先明龙超《科学技术与工程》2017,17(3)

针对说话人识别性能在噪声环境下急剧下降的问题,提出了基于调制域谱减法的鲁棒性说话人识别方法。首先在说话人识别前端通过调制域谱减法对含噪语音进行增强处理,然后通过Gammatone滤波器组提取对噪声具有抑制作用的特征,最后与说话人模型进行匹配识别。仿真结果表明,运用此方法能显著抑制噪声对说话人识别系统的影响,提高系统的识别率。相似文献

10.

一种改进的LSA语音增强算法

下载免费PDF全文

王金明周坤尹海明徐志军《解放军理工大学学报(自然科学版)》2015,(4):310-315

针对说话人识别的噪声鲁棒性问题,在对数谱最小均方差误差估计算法基础上,采用改进的最小值控制递归平均算法对语音帧信噪比进行估计,通过对前一帧的短时功率谱进行2次平滑和前向多帧最小值搜索,结合语音存在概率估计出当前帧的信噪比,并根据信噪比自适应调整增益因子的大小,对噪声进行消除。构建了一种改进的LSA语音增强方法,使用该方法可以使增强后的语音保持较高的自然度。实验结果表明,与MMSE-LSA算法比较,改进的LSA算法具有更好的语音增强效果,在5dB各类噪声环境下,其平均信噪比较MMSE-LSA算法提高1.36dB,主观语音质量评估平均提高8%。将该方法用于说话人识别系统,其检测代价较采用MMSE-LSA算法的系统平均降低3%。相似文献

11.

Robust Speech Recognition Using a Harmonic Model

许超曹志刚《清华大学学报》2004,9(2):202-206

Automatic speech recognition under conditions of a noisy environment remains a challenging problem. Traditionally, methods focused on noise structure, such as spectral subtraction, have been employed to address this problem, and thus the performance of such methods depends on the accuracy in noise estimation. In this paper, an alternative method, using a harmonic-based spectral reconstruction algorithm, is proposed for the enhancement of robust automatic speech recognition. Neither noise estimation nor noise-model training are required in the proposed approach. A spectral subtraction integrated autocorrelation function is proposed to determine the pitch for the harmonic model. Recognition results show that the harmonic-based spectral reconstruction approach outperforms spectral subtraction in the middle- and lowsignal noise ratio (SNR) ranges. The advantage of the proposed method is more manifest for non-stationary noise, as the algorithm does not require an assumption of stationary noise. 相似文献

12.

听觉掩蔽门限在说话者识别中的应用 总被引：2，自引：0，他引：2

韦晓东胡光锐任晓林《上海交通大学学报》1999,33(12):1521-1524

语音信息在人的听觉系统中的表示具有一定的冗余性．利用这一特性把丢失数据技术应用于噪声环境下说话者识别系统的性能改进．听觉掩蔽效应这一听觉现象被用来检测语音信号频谱中被噪声严重干扰的“丢失成分”．经过丢失数据补偿技术结合语音增强处理,说话者识别系统在不利环境下的准确率得到了提高．通过对宽带噪声－白噪声和一种特殊噪声——汽车噪声干扰下语音的说话者辨认实验,发现这种方法优于单独使用语音增强方法．相似文献

13.

基于自适应基追踪去噪的含噪语音压缩感知 总被引：1，自引：0，他引：1

孙林慧杨震《南京邮电大学学报(自然科学版)》2011,31(5):1-6

针对含白噪语音信号压缩采样后采用基追踪方法重构性能差的问题,提出了自适应基追踪去噪方法,该方法根据原含噪信号的信噪比自适应选择重构最佳参数,从而在重构语音的同时提高原信号信噪比。把该方法运用到含噪语音压缩感知中,对重构语音进行了主客观评价,并分析了不同压缩比下的重构性能。仿真结果显示:本文方法既实现了压缩采样,又在重构信号时实现了语音增强,优于基追踪重构方法相似文献

14.

一种改进的语音识别抗噪算法

刘菁华《华侨大学学报(自然科学版)》2009,30(1)

为了提高在噪声环境下的语音识别性能,提出一种融合信号级和特征参数级抗噪的抗噪算法.该算法首先对带噪语音用最小均方误差估计法进行语音增强,后端对原始的带噪语音运用自相关法,以有效抑制加性和卷积噪声.实验结果表明,该算法能有效提高系统在噪声环境下,特别是低信噪比情况下的识别率. 相似文献

15.

语音增强用于抗噪声语音识别 总被引：12，自引：1，他引：11

徐义芳张金杰姚开盛曹志刚王勇前《清华大学学报(自然科学版)》2001,41(1):41-44

语音识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的 ,则语音识别系统可以令人满意地工作。然而 ,当实际环境中有噪声存在时 ,语音识别系统性能急剧下降。为了让语音识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能 ,研究了一个将语音增强器和语音识别器级连起来的系统。该系统中 ,语音增强作为前端处理用于提高识别器输入端信号的信噪比。通过 3种不同的增强算法用于纯净语音和3种类型带噪语音的实验结果分析比较表明 ,这一方法对纯净语音的识别精度几乎没有任何改变而大大提高了系统的抗噪声性能相似文献

16.

基于小波变换的说话人识别技术

下载免费PDF全文

檀蕊莲柏鹏李哲姚战宏栾前进《空军工程大学学报(自然科学版)》2013,14(1):85-89

说话人识别技术是通过判断待识别人语音与预先提取的说话人语音特征是否匹配来鉴别说话人身份的一种生物认证技术,环境噪声是说话人识别技术走向实用化的一个主要障碍.针对噪声环境中说话人识别性能较差的不足,结合小波变换的优点,提出了将小波变换技术与传统的特征参数提取方式相结合的方法.该方法首先对语音信号进行小波分解,在此基础上再对小波系数进行阈值处理,仅保留阈值以上的数据,而后提取相关性不大的传统特征参数进行组合,分别作为说话人识别系统的输入矢量.仿真结果表明:在噪声环境中,说话人识别系统能较好识别出说话人,经过小波变换后再提取特征参数的方法可以得到更高的识别率,大大提高说话人识别系统的识别性能. 相似文献

17.

用DSP技术开发的一种新的语音识别系统 总被引：2，自引：0，他引：2

余小清万旺根陶安袁京贤《上海大学学报(自然科学版)》1999,5(2):110-114

本文介绍了一种基于听觉谱特征参数的语音识别方法和系统．该系统采用高速ＤＳＰ芯片ＴＭＳ３２０Ｃ２５,实现了语音信号的实时处理．用由此芯片开发的ＥＩＳＡ插卡与计算机结合,构成了一个智能化语音输入实时识别系统．实验结果表明,在小词汇量特定人条件下,该系统的正识率可达到９８％以上,在非特定人和有噪情况下,系统正识率分别为９５％和９０％以上．通过比较发现,该系统在正识率、抗噪性和鲁棒性等方面均比传统识别方法要好相似文献

18.

改进贝叶斯非负矩阵分解的语音增强算法

下载免费PDF全文

张立伟张雄伟胡永刚闵刚李轶南《解放军理工大学学报(自然科学版)》2015,(5):407-412

为了进一步提高增强语音的质量,基于传统的贝叶斯非负矩阵分解语音增强算法,考虑语音帧内原子间的相关性,提出了一种新的改进贝叶斯非负矩阵分解语音增强算法。该算法可分为训练和增强2个阶段:训练阶段利用该算法分别对纯净语音和噪声进行训练,得到纯净语音和噪声字典;增强阶段利用训练得到的纯净语音和噪声字典组成的联合字典结合,计算带噪语音时变增益,并利用最小均方误差估计得到增强语音频谱,进而重构增强语音。实验结果表明,该算法的对数频谱距离值和主观语音质量评估打分均优于非负矩阵分解(NMF)和贝叶斯非负矩阵分解(BNMF)等传统的语音增强算法,特别是在低信噪比条件下,该算法增强的效果更佳。相似文献