首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 312 毫秒
1.
近几十年来,语音识别系统已由实验室环境走向真实的世界中.在不同的环境噪声下,识别性能却仍不尽人意,尤其是在低信噪比的环境中.为解决在低信噪比情况下的低识别率的问题,以声学参数MFCC( Mel-frequen-cy cepstrum coefficient)为基础,提出了一种基于统计阈值的倒谱均值方差归一化算法,该算法...  相似文献   

2.
随着说话人识别技术的发展,实用有效的说话人识别系统越来越成为研究的重点。语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性。文中则主要在加性白噪声环境下研究M el倒谱参数、M el差分倒谱参数的顽健性以及它们经过倒谱系数零均值化(CMN)处理后识别性能的改进。从仿真结果可以看出:在加性白噪声环境下,差分倒谱参数具有很好的鲁棒性;倒谱系数零均值化能有效的除去加性白噪声。  相似文献   

3.
为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。  相似文献   

4.
低信噪比环境下语音信号的端点检测在语音识别与通信等领域具有重要意义,目前低信噪比环境下的端点检测还存在效率低、识别率不高等问题.本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相加(MFCC_a),再与短时能量相除(梅尔能量比)作为语音特征参数的语音端点检测测度,最后利用模糊C均值聚类算法自适应确定双门限阈值进行端点检测.选取TIMIT语音库中的50条语音信号进行实验,结果表明:在信噪比为5 dB、0 dB、-5 dB的噪声环境下,与能零比、谱熵等算法相比,本算法端点识别准确率均有所提高,其中在-5 dB信噪比环境下提升了约30%.  相似文献   

5.
采用模式匹配的识别技术,建立孤立词语音识别系统,基于MATLAB环境对O~9这10个数字语音进行仿真实验.在提取MFCC的基础上,整合差分倒谱参数作为语音的特征参数,并对现有的DTW算法加以改进,节省了系统匹配的计算时间,使其具有一定的鲁棒性.分别采集普通话语音和湖北、闽南、安徽3地方言的语音数据,体现了数据的完备性和系统的适用性.实验结果表明,基于改进型DTW算法和MFCC的语音识别系统具有较高识别率,取得了良好效果.  相似文献   

6.
融合语音增强与后续补偿的抗噪声语音识别方法   总被引:2,自引:1,他引:2  
为了提高基于隐含Markov模型的语音识别系统在噪声环境中的稳健性,研究了一种融合语音增强与后续补偿的抗噪声语音识别方法.在前端,语音增强有效地抑制背景噪声,从而提高了输入信号的信噪比.语音增强后的剩余噪声以及语音失真是对语音识别不利的因素,其影响将通过识别阶段的并行模型合并或特征提取阶段的倒谱均值归一化得到补偿.实验结果表明,此方法能够显著地提高语音识别系统在噪声环境中,特别是低信噪比条件下的识别精度,如对-5 dB的自噪声,该方法可将识别精度从11.7%提高至71.0%.  相似文献   

7.
矢量泰勒级数是一种有效的抗噪声鲁棒语音识别算法.然而在对数谱域,美尔滤波器组的不同通道之间有较强的相关性,因而难以从含噪语音中准确估计噪声的方差.提出了一种基于矢量泰勒级数的倒谱域特征补偿算法.该算法在倒谱域,用一个高斯混合模型描述语音倒谱特征的分布,通过矢量泰勒级数从含噪语音中估计噪声的均值和方差.实验结果表明,此算法能明显提高语音识别系统的性能,优于基于矢量泰勒级数的对数谱域特征补偿算法.  相似文献   

8.
基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。  相似文献   

9.
混响声场中语音识别方法研究   总被引:1,自引:4,他引:1  
免提式话筒语音识别系统是语音识别走向实用的目标之一.实现这一系统,首先要解决房间效应引起的混响问题.通过讨论室内混响声场中语音的特点,提出用鲁棒性特征参数——滤波规整的Mel频率倒谱参数(FNMFCC,即MFCC参数在对数功率谱域进行低通滤波,倒谱域进行均值减,并用标准差加权进行非线性规整,采用这3种措施来消除混响引起的语音参数的变化.识别方法用矢量量化法,用4组无混响数码语音进行训练,对特定人无混响和4种混响声场中共150组数码音的平均识别率达到98.7%.提出的这一新方法在不降低无混响音识别率的情况下,提高了混响声场的语音识别率.该方法不仅识别率高,而且运算量小、所需内存空间小。易于做成小型实用的快速识别系统.  相似文献   

10.
语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行平滑处理,得到信号的谱包络。然后对信号的谱包络进行计算,得到改进的MFCC参数。实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上。  相似文献   

11.
为了提高语音感知哈希算法的鲁棒性和识别小范围篡改定位的能力,利用人类听觉模型提出了一种语音感知哈希算法.该算法基于人类听觉特性,首先对倒谱系数MFCC算法每帧的滤波器数量进行控制,得到每帧语音的梅尔频率倒谱参数;其次对自适应梅尔倒谱系数MFCC参数和语音LPCC系数进行融合,并采用分块方法对特征矩阵进行处理,对特征块进行2DNMF分解运算,降低特征矩阵的复杂度;最后对分解后的系数矩阵进行哈希构造,得到语音感知哈希串,利用哈希匹配实现语音认证.结果表明:该算法可以有效提高哈希认证的鲁棒性,并能够实现语音小范围篡改定位功能.  相似文献   

12.
为解决文本无关说话人识别中训练与识别环境不同导致模式失配的问题,提出了一种采用语音增强模块进行前端预处理的i-向量说话人识别系统,从而提高系统对于环境噪声的鲁棒性.为评估不同语音增强算法的性能,利用NIST08核心测试集进行仿真实验.采用IMCRA算法对语音进行噪声估计后,分别用维纳滤波法、MMSE-LSA、传统谱减法和多频带谱减法等4种方法进行语音增强前端处理,在基于i-向量的说话人识别系统下进行实验.实验结果表明采用了语音增强的系统具有一定抗噪声性能,并且在高信噪比条件下,基于多频带的谱减法在此系统下性能最佳,而低信噪比情况下MMSE-LSA算法更有优势.  相似文献   

13.
倒谱域统计均值的稳定性已被一些文献用来嵌入水印,但其水印的嵌入强度等参数是根据实验获得的,这些参数需要通过反复实验来调整,因难以找到水印鲁棒性和透明性达到最佳折中的参数,故提出一种根据信噪比来调整水印鲁棒性和透明性关系的自适应复倒谱音频水印算法.该算法实现了水印盲检测,水印的提取不需原始音频和原始水印.实验结果表明,该算法在满足透明性的要求下具有较好的鲁棒性.  相似文献   

14.
针对Mel频率倒谱系数(Mel frequency cepstralcoefficient,MFCC)特征的说话人确认系统在干净语音环境下具有很高识别率但在噪音环境下识别率急剧下降的缺点,构建了基于感知对数面积比系数(perceptual log area ratio,PLAR)特征的说话人确认系统,并对该系统的噪音鲁棒性进行研究。结果表明:PLAR特征具有较强的噪音鲁棒性。将PLAR与MFCC进行特征域和分数域的融合,利用两者之间存在着的互补性,可有效提高说话人确认系统的识别性能。  相似文献   

15.
提出了一种基于SDCN算法的鲁棒性语音命令识别。依赖于信噪比的倒谱正常化(SDCN)算法直接在倒谱域根据输入语音帧的信噪比(SNR)来增加一补偿矢量,从而恢复未受污染的净语音信号,补偿矢量直接从训练环境和测试环境中记录的语音倒谱中逐帧比较得到,该算法对退化的环境具有很强的鲁棒性,实验结果证明,该算法简单,有效。  相似文献   

16.
为了提升说话人识别技术在复杂噪声环境下的识别性能,提出了一种基于高斯均值矩阵和卷积神经网络的鲁棒性说话人识别方法,应用于纯净语音训练出的模型上测试含噪语音的场景.其中高斯均值矩阵是采用最大后验概率(MAP)对传统的梅尔频率倒谱系数(MFCC)特征进行自适应操作得到的,这一操作增加了帧与帧之间的关联性,使特征携带更丰富的说话人身份信息.同时采用卷积神经网络进一步对帧层面的信息进行对准,并从数据中学习到更有利于说话人识别的特征表示,从而提升说话人识别的鲁棒性.实验结果表明在Libri语音数据集上,所提出方法的鲁棒性优于GMM-UBM和GSV-SVM算法.  相似文献   

17.
针对现有的说话人识别方法对环境噪声较为敏感的问题,提出了一种与文本无关的单训练样本说话人识别方法。该方法能够提取语音时频谱的局部特征,此特征不仅对白噪声、高斯噪声、粉红噪声有很强的鲁棒性,而且能够充分反映说话人的基本发声特性。针对该局部特征的基本特点,给出了适合该局部特征的贝叶斯决策方法。对英文与汉语语音数据库的仿真实验表明,该识别方法可以实现单训练样本下的说话人识别,识别精度明显高于现有的Mel频率倒谱系数(MFCC)与线性预测编码(LPCC)语音特征,而且对白噪声等各类环境噪声有较高的鲁棒性。  相似文献   

18.
针对在低信噪比环境下语音增强对语音识别率的提升不明显的问题,提出一种用在识别系统前端的麦克风阵列增强算法。该阵列增强算法基于相干滤波和频率带宽波束形成后置改进维纳滤波器。首先将采集到的阵列信号,求相邻通道间的相关函数,利用阵元间信号的相关性进行初始噪声抑制,然后利用频域宽带最小方差无畸变响应(MVDR)通过对目标声源信息的获取,保留目标声源方向的信号并抑制其他方向的信号干扰,再通过改进的维纳滤波器去除噪声残留提升语音可懂度,最后用梅尔频率倒谱系数(MFCC)和隐马尔科夫模型(HMM)对增强后的语音信号做特征提取并识别。仿真过程模仿双耳采集数据,结果表明该语音增强方法在低信噪比环境下获得较好的增强效果,能有效的提高低信噪比环境下的语音识别率。  相似文献   

19.
针对传统语音端点检测方法在噪声环境下鲁棒性较差以及对语音段检测效果不佳的问题,提出一种多特征融合的语音端点检测方法.首先,提取带噪语音信号的子带谱熵特征和基于Mel频率倒谱系数(Mel Frequency Cepstral Coefficient, MFCC)的投影特征,并将Gammatone频率倒谱系数的第一维系数GFCC0特征应用到语音端点检测任务中;然后,对3类特征进行自适应加权融合,得到适用于端点检测的融合特征;最后,采用模糊C均值聚类自适应估计门限阈值,再通过双门限法得到端点检测的结果.所提方法和已有传统方法相比,在7种噪声环境下均取得了更好的端点检测结果,提升了语音端点检测的准确率,特别是在volvo噪声环境下的端点检测准确率可以达到94.5%以上.  相似文献   

20.
在说话人识别系统中,传统梅尔倒频谱系数(MFCC)所提取特征不能够很好的反映说话人动态特征,尤其在噪声环境中,识别率较低,鲁棒性不足。针对以上问题,提出一种基于改进梅尔倒频谱系数(MFCC)的方法,通过多窗谱估计和一阶、二阶差分的方法提升识别性能。实验结果证明,在纯净语音和添加信噪的情况下,改进后方法的识别准确率都有所提升。当训练集为纯净语音,只为测试集添加噪声时,实验结果依然有较高的准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号