首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
矢量泰勒级数是一种有效的抗噪声鲁棒语音识别算法.然而在对数谱域,美尔滤波器组的不同通道之间有较强的相关性,因而难以从含噪语音中准确估计噪声的方差.提出了一种基于矢量泰勒级数的倒谱域特征补偿算法.该算法在倒谱域,用一个高斯混合模型描述语音倒谱特征的分布,通过矢量泰勒级数从含噪语音中估计噪声的均值和方差.实验结果表明,此算法能明显提高语音识别系统的性能,优于基于矢量泰勒级数的对数谱域特征补偿算法.  相似文献   

2.
近几十年来,语音识别系统已由实验室环境走向真实的世界中。在不同的环境噪声下,识别性能却仍不尽人意,尤其是在低信噪比的环境中。为解决在低信噪比情况下的低识别率的问题,以声学参数MFCC(Mel-frequency cepstrum coefficient)为基础,提出了一种基于统计阈值的倒谱均值方差归一化算法,该算法能进一步减小训练环境和测试环境的不匹配程度,从而提升了语音识别系统对环境噪声的鲁棒性。首先,对输入的语音提取MFCC声学参数,然后对提取的声学参数作均值方差归一化处理,最后采用统计阈值的方法抑制归一化后存在变异的特征。该算法能增加带噪语音特征和纯净语音特征的相似性;与MFCC为基线的系统相比,在低信噪比情况下,该算法的错误率最高下降约40%,同时该方法也优于其他的鲁棒性特征倒谱均值减和倒谱均值归一。  相似文献   

3.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别   总被引:1,自引:0,他引:1  
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率.  相似文献   

4.
8kbit/s短延时语音编码算法LD-ACELP,采用了代数码本激励线性预测(ACELP)的编码方法,利用语音的帧间相关性对线谱对参数采用了分裂式矢量量化技术,并采用高效的码本结构、码本搜索技术和增益矢量量化技术来获得较高的语音合成质量和较短的算法延时。LD-ACELP的帧长为10ms,算法延时为15ms。通过信噪比及人耳主观听觉实验等性能测试表明,该算法具有与国际电联16kb/s短延时语音编码算法LD-CELP(G.728)相当的语音合成质量。  相似文献   

5.
针对说话人识别的噪声鲁棒性问题,在对数谱最小均方差误差估计算法基础上,采用改进的最小值控制递归平均算法对语音帧信噪比进行估计,通过对前一帧的短时功率谱进行2次平滑和前向多帧最小值搜索,结合语音存在概率估计出当前帧的信噪比,并根据信噪比自适应调整增益因子的大小,对噪声进行消除。构建了一种改进的LSA语音增强方法,使用该方法可以使增强后的语音保持较高的自然度。实验结果表明,与MMSE-LSA算法比较,改进的LSA算法具有更好的语音增强效果,在5dB各类噪声环境下,其平均信噪比较MMSE-LSA算法提高1.36dB,主观语音质量评估平均提高8%。将该方法用于说话人识别系统,其检测代价较采用MMSE-LSA算法的系统平均降低3%。  相似文献   

6.
为了提高语音感知哈希算法的鲁棒性和识别小范围篡改定位的能力,利用人类听觉模型提出了一种语音感知哈希算法.该算法基于人类听觉特性,首先对倒谱系数MFCC算法每帧的滤波器数量进行控制,得到每帧语音的梅尔频率倒谱参数;其次对自适应梅尔倒谱系数MFCC参数和语音LPCC系数进行融合,并采用分块方法对特征矩阵进行处理,对特征块进行2DNMF分解运算,降低特征矩阵的复杂度;最后对分解后的系数矩阵进行哈希构造,得到语音感知哈希串,利用哈希匹配实现语音认证.结果表明:该算法可以有效提高哈希认证的鲁棒性,并能够实现语音小范围篡改定位功能.  相似文献   

7.
针对噪声环境下语音识别系统性能下降的问题,提出一种基于语音时频相关性的Mel特征矢量聚类补偿算法。该算法首先实现掩码估计,利用纯净语音信号时域和频域的相关性,实现了时频块的有效划分和基于时频块的语音特征聚类。在此基础上,对带噪语音的Mel语谱进行特征补偿。采用HTK工具和TIDIGITS数据库加入不同类别噪声的语音测试结果表明:该算法在不同信噪比条件下,获得了较基于频域相关性聚类特征补偿算法更好的性能。  相似文献   

8.
为降低噪声对语音通信的干扰,提出了一种基于谱减的语音增强算法的改进方法。根据噪声频谱的G auss统计模型修正语音增强过程中噪声频谱的估计方法,利用帧内、帧间约束估计每一个频点的先验信噪比,提出了一种简便的估计语音在每一个频点出现的概率的方法,得出了修正的语音增强算法。在白噪声以及坦克噪声环境中分别对算法的性能进行测试。实验结果表明:在几乎不损伤语音清晰度的前提下,该算法使“音乐噪声”得到了更好的抑制,同时信噪比提高了约8 dB以上。  相似文献   

9.
宽带ISF参数的矢量量化是语音编码中的重要环节,其量化性能的高低对于解码端语音的质量有重要影响.针对宽带语音ISF参数矢量量化问题,提出了一种新的量化方法.该方法利用ISF参数帧间相关性,将相邻2帧ISF参数的条件PDF用高斯概率模型表示.与传统分裂矢量量化不同,该方法首先根据前一帧的量化结果对当前帧分类、选择合适的码书,然后对该帧在选定的码书中进行分裂矢量量化.实验表明,该算法在每帧编码比特数44时达到透明量化,且平均谱失真比利用传统分裂矢量量化时的谱失真小.  相似文献   

10.
针对NAO机器人自身语音识别准确率低问题,提出一种调用云平台服务进行语音识别方法。通过相位补偿的调制域谱减法对声音进行降噪处理,提高语音信噪比,基于双门限判决方法对声音信号进行端点检测,删除噪声帧,保留有话帧,最终生成WAV文件并传输识别,提高了NAO机器人的实用性、功能多样性。实验结果表明,本文算法在低信噪比情况下取得了良好识别效果,具有较强鲁棒性。  相似文献   

11.
低信噪比下基于谱熵的语音端点检测算法   总被引:14,自引:0,他引:14  
为提高语音端点检测系统在低信噪(0 dB以下)下检测的准确率,提出了一种基于谱熵的端点检测算法。将每帧信号分为16个子带,选取频谱分布在250~3.5 kH z并且能量不超过该帧总能量90%的子带,计算经过语音增强后的子带能量以及各子带信噪比,根据各子带信噪比的不同调整其在整个谱熵计算过程中的权重,然后平滑谱熵,以最终的谱熵作为端点检测的依据。实验结果表明,此方法在较低的信噪比下能够显著地提高端点检测的准确率。对坦克噪声,检测效果明显优于G.729中的端点检测算法,即使在-5 dB的信噪比下,仍然可以达到95%以上的检测率。  相似文献   

12.
基于小波变换的语音段起止端点检测算法   总被引:9,自引:0,他引:9  
提出一种基于小波变换的语音段起止端点检测算法.传统的语音段起止端点检测算法大都是在时域上根据能量累积的大小判别语音段和噪声段,这些算法只是适用于高信噪比的情况.对于低信噪比的情况,这些算法往往要借助平均过零率等辅助特征.这样做不但增加了算法的复杂度,而且也未必奏效.单音节或浊辅音汉字的平均过零率与噪声的平均过零率大致相当.根据小波变换的特性,针对主要由白色噪声组成的噪声背景,提出一种新的语音段起止端点检测算法.这种算法根据白色噪声在小波变换域各个子带的平均能量变化平缓的特点判别语音段和噪声段.实验结果表明,算法即使在低信噪比的情况下也能正确判别语音段和噪声段.  相似文献   

13.
基于扩展谱相减与SAP的带噪语音端点检测   总被引:2,自引:0,他引:2  
为提高低信噪比时带噪语音端点检测的性能,提出了一种将扩展的谱相减法与SAP(Speech AbsenceProbab ility)软门限相结合的方法。采用基于噪声补偿结构的扩展谱相减法,通过使用自适应的判决规则,在不需要进行语音激活检测的情况下有效地去除了背景噪声,克服了单麦克输入时无法在语音段对噪声进行估计的缺点。同时采用非语音段概率SAP软门限,直接对增强后的语音信号进行检测,有效提高了语音段起止端点检测的精确度和可靠性。实验结果表明,该方法比短时能量方法的计算效率高,在信噪比为-10 dB时仍能完成端点检测。  相似文献   

14.
基于倒谱距离的语音端点检测改进算法   总被引:5,自引:1,他引:5       下载免费PDF全文
在讨论传统倒谱距离语音端点检测算法不足的基础上,提出了一种改进方案,该方法首先估计短时信噪比,然后由统计方法确定短时信噪比与门限的关系,进而完成正确的语音端点判决。通过对3种典型噪声环境下信噪比从-5 dB到20 dB的带噪语音信号进行的仿真实验结果表明,所提方法能更为准确地检测到语音端点。  相似文献   

15.
为提高实时通信中语音端点检测系统的性能,提出了一种基于能量和鉴别信息的端点检测算法。该算法利用帧信号的能量、子带信号的能量等参数,计算该帧信号与噪声帧基于子带能量分布概率的鉴别信息。算法通过利用鉴别信息,能够在包括语音帧在内的所有帧中更新噪声的能量,从而更准确地跟踪噪声能量的变化。实验结果表明:与基于能量的端点检测算法相比,该方法在信噪比变化比较剧烈的情况下仍然能够较准确地进行端点检测,在0~10 dB范围内变化的坦克噪声环境中,准确率比后者提高约24%。  相似文献   

16.
基于多尺度分形维数的汉语语音声韵切分   总被引:10,自引:0,他引:10  
针对低信噪比环境 ,提出一种汉语语音声韵母切分新方法。以语音信号非线性产生机制中存在混沌特性为依据 ,将普通分形维数扩展为多尺度分形维数 ,用于考察语音信号在不同最大观测分辨率下的局部自相似性。利用稳定声韵母段及其之间过渡段在多尺度分形维数上的不同特性能较好地区分二者。由此针对汉语音节“声母 +韵母”的结构特点设计了一种简单而高效的汉语语音声韵母切分方法。在干净语音测试集下测试 ,切分正确率为 95 .2 % ;在信噪比为10 d B的噪声环境下 ,正确率达到 82 .3%。  相似文献   

17.
针对耳聋患者的听阈曲线与正常人之间的区别,提出一种在频域内实现语音响度补偿的新算法,即频率细分响度补偿法,就是对每一帧语音信号频谱变换后,对频谱所含的每个频率点进行相应的增益补偿,并用TMS320VC5509A DSP芯片实现。  相似文献   

18.
一种新的对数能量谱熵语音端点检测方法   总被引:1,自引:0,他引:1  
将一种新的对数能量(LE)特征和谱熵(SE)特征相结合,提出一种新的对数能量谱熵(LESE)特征,采用模糊C均值聚类算法和贝叶斯信息准则算法进行LESE特征门限估计,并使用双门限法进行语音端点检测.在TIMIT连续语音库上的实验结果表明,相比于能量谱熵(EE)法和对数能量(LE)法,在噪声环境下LESE法具有更好的检测性能,表现出更好的稳健性.当信噪比为-5 dB时,LESE法的检测错误率仅为18.02%,在信噪比为0~10 dB时,其检测错误率要明显低于EE法和LE法.  相似文献   

19.
提出了一种采用PN序列作为正交频分复用(OFDM)信号引导序列的帧同步方法,此方法能够在强窄带干扰或极低信噪比信道中精确地实现帧同步,克服了基于循环前缀的同步算法在强窄带干扰信道中以及在极低信噪比条件下,无法实现精确同步的问题。仿真结果表明,基于PN序列的帧同步算法在信噪比为-5dB条件下仍能够实现精确同步,且具有抗多径效应和抗强窄带干扰的能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号