期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

韦晓东胡光锐《上海交通大学学报》1998,32(10):10-13

汽车中的话音拨号系统是自动语音识别技术的应用热点．自动语音识别系统是一个基于训练的系统．在汽车噪声中,由于实际应用环境与形成系统参数的训练环境的失配,传统语音识别系统的性能会大幅度地下降,从而无法实用．为了提高语音识别系统在特定环境下的识别率及实用性,首先根据汽车环境中语音的失真模型分析了系统性能下降的原因,然后针对加性汽车噪声与信道失真对系统的影响,讨论了在汽车噪声中改善语音识别系统性能的方法．提出了在识别系统中用基于子带的语音增强算法和倒谱均值相减算法相结合的方法．对大量的多人连续数字串语音的识别实验表明,这一方法大大提高了系统在汽车噪声环境中的识别率,它还可以简便、实时的实现,具有一定的实用性．相似文献

2.

语音增强用于抗噪声语音识别 总被引：12，自引：1，他引：11

徐义芳张金杰姚开盛曹志刚王勇前《清华大学学报(自然科学版)》2001,41(1):41-44

语音识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的 ,则语音识别系统可以令人满意地工作。然而 ,当实际环境中有噪声存在时 ,语音识别系统性能急剧下降。为了让语音识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能 ,研究了一个将语音增强器和语音识别器级连起来的系统。该系统中 ,语音增强作为前端处理用于提高识别器输入端信号的信噪比。通过 3种不同的增强算法用于纯净语音和3种类型带噪语音的实验结果分析比较表明 ,这一方法对纯净语音的识别精度几乎没有任何改变而大大提高了系统的抗噪声性能相似文献

3.

鲁棒语音识别技术综述 总被引：1，自引：0，他引：1

吕钊吴小培张超《安徽大学学报(自然科学版)》2013,(5):17-24

鲁棒语音识别是为了解决噪声环境所引起的语音识别系统识别和训练不匹配的情况.依据噪声对语音识别系统的影响,从信号空间、特征空间及模型空间3个层面上分别对语音增强技术、特征增强技术及语音模型补偿、增强技术进行了总结,并分析了不同方法的特点、实现及应用. 相似文献

4.

融合语音增强与后续补偿的抗噪声语音识别方法 总被引：2，自引：1，他引：2

丁沛曹志刚《清华大学学报(自然科学版)》2003,43(7):919-922

为了提高基于隐含Markov模型的语音识别系统在噪声环境中的稳健性,研究了一种融合语音增强与后续补偿的抗噪声语音识别方法.在前端,语音增强有效地抑制背景噪声,从而提高了输入信号的信噪比.语音增强后的剩余噪声以及语音失真是对语音识别不利的因素,其影响将通过识别阶段的并行模型合并或特征提取阶段的倒谱均值归一化得到补偿.实验结果表明,此方法能够显著地提高语音识别系统在噪声环境中,特别是低信噪比条件下的识别精度,如对-5 dB的自噪声,该方法可将识别精度从11.7%提高至71.0%. 相似文献

5.

基于Kinect辅助的机器人带噪语音识别

《清华大学学报(自然科学版)》2017,(9)

音视频信息融合可以提升机器人在噪声环境下的语音识别性能。然而受说话者的头部旋转、唇部尺寸不一、距摄像头距离不固定以及光照等因素影响,唇部信息不能得到有效的全面表征。该文提出融合机器人与Kinect的多模态系统。该系统采用Kinect获取3-D数据和视觉信息,并使用3-D数据重构侧唇来补充音视频信息。一系列基于特征融合和决策融合方法的结果表明:该文提出的多模态系统优于基于音视频单流和双流的语音识别系统,能够辅助机器人在自身噪声环境下的语音识别。相似文献

6.

低信噪比环境下的麦克风阵列语音识别算法研究

王群曾庆宁郑展恒《科学技术与工程》2017,17(31)

针对在低信噪比环境下语音增强对语音识别率的提升不明显的问题,提出一种用在识别系统前端的麦克风阵列增强算法。该阵列增强算法基于相干滤波和频率带宽波束形成后置改进维纳滤波器。首先将采集到的阵列信号,求相邻通道间的相关函数,利用阵元间信号的相关性进行初始噪声抑制,然后利用频域宽带最小方差无畸变响应(MVDR)通过对目标声源信息的获取,保留目标声源方向的信号并抑制其他方向的信号干扰,再通过改进的维纳滤波器去除噪声残留提升语音可懂度,最后用梅尔频率倒谱系数(MFCC)和隐马尔科夫模型(HMM)对增强后的语音信号做特征提取并识别。仿真过程模仿双耳采集数据,结果表明该语音增强方法在低信噪比环境下获得较好的增强效果,能有效的提高低信噪比环境下的语音识别率。相似文献

7.

PMC在噪声环境下的语音识别中的应用

下载免费PDF全文

金连斌丁庆海陈显治《解放军理工大学学报(自然科学版)》2001,2(2):42-45

今天的语音识别正处于由实验室技术走向实用化,产品化的关键时期,然而,现有的绝大我数语音识别系统在噪声环境中的性能都不可避免地急上降,环境噪声已经成为语音识技术商品化的一个主要障碍,因此在语音识技术逐渐走向实用化的过程中,噪声语音识别日益成为一个重要的研究领域,遗憾的是,由于噪声语音识问题本身的复杂性,至今还没有一种方法可以圆满地解决这一问题,拟从模型补偿方面,对噪声环境下的孤立词语音识别进行一些探索,重点研究一个在噪声环境下的语音识别算法－－并行模型组合方法（PMC）,详细论述了其原理以及在噪声环境下的语音识别中的应用。实验中,我们使用汉语的数字语音,分别在3种不同噪声不同信噪比条件下对这一方法进行了识别率测试,结果显示,该方法有着令人振奋的识别效果。相似文献

8.

基于支持向量机和小波分析的说话人识别研究

张振领贾仰理《聊城大学学报(自然科学版)》2007,20(4):84-87

说话人识别技术目前已经成为身份认证及人工智能领域研究的一个热点,解决噪声环境下的说话人识别问题具有重要的理论价值和深远的实用意义．针对这一问题,提出了一种基于支持向量机和小波分析的识别方法及其框架模型,并且设计与实现了一个识别系统,即利用小波阈值去噪法将语音信号和噪声分离,实现语音增强,最终采用SVM分类器基于样本进行训练和测试,实现说话人的分类识别．相似文献

9.

自适应小波阈值语音增强新方法 总被引：1，自引：0，他引：1

马晓红宋辉殷福亮《大连理工大学学报》2006,46(4):561-566

针对单一小波闻值语音增强方法降低语音可懂度这一问题,提出一种基于自适应小波闻值的语音增强新方法．根据噪声帧频谱的平整度判断出噪声的类型,即是白噪声（合频响曲线比较平整的有色噪声）还是频响曲线不平整的有色噪声．由于不同类型的噪声具有不同性质的Lipschitz指数,对两种不同的噪声类型分别采用不同的自适应小波阚值对带噪语音信号进行增强处理．用计算机仿真和实际环境录制的语音数据对该方法的性能进行了测试,实验结果表明在两种实验数据情况下,该方法均具有较好的噪声抑制能力．相似文献

10.

利用隐空间投影算法的模型自适应方法

王晶莹王作英《清华大学学报(自然科学版)网络.预览》2007,(7)

为了降低语音识别系统中噪声的影响,提出了一种利用隐空间投影算法的模型自适应方法。该方法利用状态间的相关性提取出反映码本和待识别语音共同特性的基矢量。由于语音与噪声是相互独立的,因此,当语音识别系统中有噪声存在时,认为不能用基矢量表示的那部分余量就是噪声。与本征音方法相比,该方法可以有效地降低噪声对语音识别系统的影响。该方法在提取基矢量时利用了自适应数据,并且节省了存储空间。实验结果表明:该方法在噪声环境下相对于最大似然线性回归自适应方法有4-9个百分点的提高,相对于最大后验概率和本征音方法有更大的提高。相似文献

11.

含语音增强模块的i-向量说话人识别性能分析

李昕李为游寒旭朱杰《上海师范大学学报(自然科学版)》2016,45(2):237-242

为解决文本无关说话人识别中训练与识别环境不同导致模式失配的问题,提出了一种采用语音增强模块进行前端预处理的i-向量说话人识别系统,从而提高系统对于环境噪声的鲁棒性.为评估不同语音增强算法的性能,利用NIST08核心测试集进行仿真实验.采用IMCRA算法对语音进行噪声估计后,分别用维纳滤波法、MMSE-LSA、传统谱减法和多频带谱减法等4种方法进行语音增强前端处理,在基于i-向量的说话人识别系统下进行实验.实验结果表明采用了语音增强的系统具有一定抗噪声性能,并且在高信噪比条件下,基于多频带的谱减法在此系统下性能最佳,而低信噪比情况下MMSE-LSA算法更有优势. 相似文献

12.

Robust Speech Recognition Using a Harmonic Model

许超曹志刚《清华大学学报》2004,9(2):202-206

Automatic speech recognition under conditions of a noisy environment remains a challenging problem. Traditionally, methods focused on noise structure, such as spectral subtraction, have been employed to address this problem, and thus the performance of such methods depends on the accuracy in noise estimation. In this paper, an alternative method, using a harmonic-based spectral reconstruction algorithm, is proposed for the enhancement of robust automatic speech recognition. Neither noise estimation nor noise-model training are required in the proposed approach. A spectral subtraction integrated autocorrelation function is proposed to determine the pitch for the harmonic model. Recognition results show that the harmonic-based spectral reconstruction approach outperforms spectral subtraction in the middle- and lowsignal noise ratio (SNR) ranges. The advantage of the proposed method is more manifest for non-stationary noise, as the algorithm does not require an assumption of stationary noise. 相似文献

13.

用于语音识别的减谱结合RASTA的抗噪声方法 总被引：1，自引：0，他引：1

黄石磊武剑虹匡镜明《北京理工大学学报》2003,23(5):621-624

主要论述加性和卷积性噪声条件下语音识别的抗噪方法．在特征提取阶段，用功率谱短时均值相减的谱减方法补偿加性噪声的影响，用在Mel频标倒谱域RASTA(relative specllral)滤波补偿卷积性噪声对语音识别系统的影响．在汉语非特定人孤立数字识别实验中，使用该方法的误识率比未使用该方法要低，并且需要很小的噪声先验知识和假设，运算简单．实验证明，提出的减谱结合RASTA的方法是一种比较有效地削减噪声的方法。相似文献

14.

调制域谱减法用于鲁棒性语音识别 总被引：2，自引：2，他引：0

胡丹曾庆宁龙超《科学技术与工程》2016,16(4)

针对语音识别在实际环境中缺乏稳健性的问题,提出了将调制域谱减法应用于语音识别前端的方法。先将语音信号变换到调制域,在调制域用谱减法将信号增强,在减少语音畸变的基础上提高信噪比,然后再进行识别。仿真实验表明,调制域谱减法能在较大的信噪比区间内提高系统识别率,证明此方法能显著提高语音识别系统的抗噪声能力。相似文献

15.

基于浊音语音谐波谱子带加权重建的抗噪声说话人识别 总被引：1，自引：0，他引：1

曾毓敏吴镇扬《东南大学学报(自然科学版)》2008,38(6)

提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率. 相似文献

16.

混响声场中语音识别方法研究 总被引：1，自引：4，他引：1

栗学丽徐柏龄《南京大学学报(自然科学版)》2003,39(4):525-531

免提式话筒语音识别系统是语音识别走向实用的目标之一．实现这一系统，首先要解决房间效应引起的混响问题．通过讨论室内混响声场中语音的特点，提出用鲁棒性特征参数——滤波规整的Mel频率倒谱参数(FNMFCC，即MFCC参数在对数功率谱域进行低通滤波，倒谱域进行均值减，并用标准差加权进行非线性规整，采用这3种措施来消除混响引起的语音参数的变化．识别方法用矢量量化法，用4组无混响数码语音进行训练，对特定人无混响和4种混响声场中共150组数码音的平均识别率达到98．7％．提出的这一新方法在不降低无混响音识别率的情况下，提高了混响声场的语音识别率．该方法不仅识别率高，而且运算量小、所需内存空间小。易于做成小型实用的快速识别系统．相似文献

17.

基于调制域谱减法的鲁棒性说话人识别 总被引：1，自引：1，他引：0

程小伟王健曾庆宁谢先明龙超《科学技术与工程》2017,17(3)

针对说话人识别性能在噪声环境下急剧下降的问题,提出了基于调制域谱减法的鲁棒性说话人识别方法。首先在说话人识别前端通过调制域谱减法对含噪语音进行增强处理,然后通过Gammatone滤波器组提取对噪声具有抑制作用的特征,最后与说话人模型进行匹配识别。仿真结果表明,运用此方法能显著抑制噪声对说话人识别系统的影响,提高系统的识别率。相似文献

18.

用DSP技术开发的一种新的语音识别系统 总被引：2，自引：0，他引：2

余小清万旺根陶安袁京贤《上海大学学报(自然科学版)》1999,5(2):110-114

本文介绍了一种基于听觉谱特征参数的语音识别方法和系统．该系统采用高速ＤＳＰ芯片ＴＭＳ３２０Ｃ２５,实现了语音信号的实时处理．用由此芯片开发的ＥＩＳＡ插卡与计算机结合,构成了一个智能化语音输入实时识别系统．实验结果表明,在小词汇量特定人条件下,该系统的正识率可达到９８％以上,在非特定人和有噪情况下,系统正识率分别为９５％和９０％以上．通过比较发现,该系统在正识率、抗噪性和鲁棒性等方面均比传统识别方法要好相似文献

19.

基于CGRU多输入特征的地空通话自动切分

郭东岳林毅杨波《四川大学学报(自然科学版)》2020,57(5):887-893

自动语音切分是语音识别、声纹识别、语音降噪等语音应用中非常重要的预处理环节,切分算法的优劣直接影响了系统输出结果的精度.在空管地空通话中,传输信道噪声、天气因素以及说话人工作状态均会对语音信号产生影响,进而在一定程度上影响语音切分性能.在分析空管地空通话语音特性基础上,提出了一种基于CGRU网络多输入特征的自动语音切分方法.该方法结合地空通话的特点,采用深度学习的方法进一步提取语音信号的时域和频域非线性特征,将语音信号帧分类为语音帧、结束帧以及其他帧三类.实验对比了多种语音特征作为输入对切分效果的影响,同时验证了GMM、CNN、CLDNN、CGRU等切分算法在真实地空通话测试集上的表现,并提出了一种简单预测结果平滑算法.实验结果表明,文中提出的自动切分方法在地空通话中具有明显优势,分类模型的AUC值达到了0.98. 相似文献

20.

一种基于听觉掩蔽效应的语音增强方法 总被引：5，自引：1，他引：5

张金杰曹志刚马正新《清华大学学报(自然科学版)》2001,41(7):1-4

为提高增强语音的听觉效果 ,研究了一种基于听觉掩蔽效应的语音增强方法。推出了一个功率谱域的基于听觉掩蔽效应的不等式准则 ,并用这个准则动态地选择一个作为语音短时谱幅度估计器的非线性函数的参数值 ,通过这个参数自适应变化的非线性函数对语音谱幅度进行估计实现语音增强。在此基础上 ,设计实现了一个单声道语音增强算法。对增强语音的客观测试和非正式听音测试表明 :相对于传统的减谱法和对数短时谱幅度最小均方误差估计增强法 ,基于听觉掩蔽效应的语音增强方法能更好地抑制背景噪声相似文献