首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
低信噪比环境下语音信号的端点检测在语音识别与通信等领域具有重要意义,目前低信噪比环境下的端点检测还存在效率低、识别率不高等问题.本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相加(MFCC_a),再与短时能量相除(梅尔能量比)作为语音特征参数的语音端点检测测度,最后利用模糊C均值聚类算法自适应确定双门限阈值进行端点检测.选取TIMIT语音库中的50条语音信号进行实验,结果表明:在信噪比为5 dB、0 dB、-5 dB的噪声环境下,与能零比、谱熵等算法相比,本算法端点识别准确率均有所提高,其中在-5 dB信噪比环境下提升了约30%.  相似文献   

2.
传统的语音端点检测方法以信号的短时能量、过零率等简单特征作为判决特征参数.这些方法在实际应用中,尤其当信号信噪比比较低时,无法满足系统的需要.文中利用语音信号的倒谱特征作为判决抽样信号帧是否为语音信号的依据,并提出了倒谱距离测量法和循环神经网络法.通过对宽带噪声-白噪声干扰情况和一种特殊噪声——汽车噪声情况的实验,发现倒谱特征参数的语音信号端点检测方法在噪声环境下具有传统的能量方法无法比拟的优越性,更适合于实际应用.  相似文献   

3.
针对传统语音端点检测方法在噪声环境下鲁棒性较差以及对语音段检测效果不佳的问题,提出一种多特征融合的语音端点检测方法.首先,提取带噪语音信号的子带谱熵特征和基于Mel频率倒谱系数(Mel Frequency Cepstral Coefficient, MFCC)的投影特征,并将Gammatone频率倒谱系数的第一维系数GFCC0特征应用到语音端点检测任务中;然后,对3类特征进行自适应加权融合,得到适用于端点检测的融合特征;最后,采用模糊C均值聚类自适应估计门限阈值,再通过双门限法得到端点检测的结果.所提方法和已有传统方法相比,在7种噪声环境下均取得了更好的端点检测结果,提升了语音端点检测的准确率,特别是在volvo噪声环境下的端点检测准确率可以达到94.5%以上.  相似文献   

4.
应用倒谱特征的带噪语音端点检测方法   总被引:7,自引:0,他引:7  
传统的语音端点检测方法以信号的短时能量、过零率等简单特征为判决特征参数。这些方法在实际应用中,尤其当信号噪比比较低时,无法满足系统的需要。文中利用语音信号的倒谱特征作为判决抽样信号帧是否为语音信号的依据,并提出了倒谱距离测量法和循环神经网络法,通过对宽带噪声-白噪声干扰情况和一种特殊噪声-汽车噪声情况的实验,发现倒谱特征参数的语音信号端点检测方法在噪声环境下具有传统的能量方法无法比拟的优越性,更适  相似文献   

5.
基于倒谱距离的语音端点检测改进算法   总被引:6,自引:1,他引:5  
在讨论传统倒谱距离语音端点检测算法不足的基础上,提出了一种改进方案,该方法首先估计短时信噪比,然后由统计方法确定短时信噪比与门限的关系,进而完成正确的语音端点判决。通过对3种典型噪声环境下信噪比从-5 dB到20 dB的带噪语音信号进行的仿真实验结果表明,所提方法能更为准确地检测到语音端点。  相似文献   

6.
张开生  赵小芬  王泽  宋帆 《科学技术与工程》2020,20(35):14536-14542
针对复杂环境下语音端点检测准确率低下且检测耗时过长的问题,研究一种基于EEMD和OS-DL联合去噪的语音端点检测算法。首先利用EEMD(总体平均经验模态分解)算法对输入语音进行分解得到IMF(本征模式分量),然后使用OS-DL(一步式字典)算法分别对纯净语音信号与噪声信号进行训练,得到纯净语音信号和噪声信号的幅度谱字典,进而对幅度谱进行稀疏表示,利用得到的系数矩阵重新构建出语音信号频谱,将重构出的语音信号频谱经过傅里叶逆变换得到降噪后的语音信号,最后对降噪后的语音信号利用均匀子带频带方差法进行端点检测。实验结果表明:该算法在复杂环境信噪比低于-10dB情况下检测准确率仍可达到85%以上,且平均检测时间缩短至传统端点检测算法的1/3。  相似文献   

7.
低信噪比下基于谱熵的语音端点检测算法   总被引:14,自引:0,他引:14  
为提高语音端点检测系统在低信噪(0 dB以下)下检测的准确率,提出了一种基于谱熵的端点检测算法。将每帧信号分为16个子带,选取频谱分布在250~3.5 kH z并且能量不超过该帧总能量90%的子带,计算经过语音增强后的子带能量以及各子带信噪比,根据各子带信噪比的不同调整其在整个谱熵计算过程中的权重,然后平滑谱熵,以最终的谱熵作为端点检测的依据。实验结果表明,此方法在较低的信噪比下能够显著地提高端点检测的准确率。对坦克噪声,检测效果明显优于G.729中的端点检测算法,即使在-5 dB的信噪比下,仍然可以达到95%以上的检测率。  相似文献   

8.
传统的端点检测在信噪比较高的环境下可以有效地对语音进行端点检测,但是在低信噪比环境下端点检测的正确率急剧下降。针对在低信噪比环境下语音端点检测正确率不高的问题,提出一种将调制域谱减法和对数能量子带谱熵相结合的的端点检测算法;该算法首先利用调制域谱减法去除带噪语音的噪声以提高语音信号的信噪比,然后结合对数能量和子带谱熵算法对消噪后的语音信号进行端点检测。实验仿真结果表明,该算法在低信噪比环境下能有效提高语音端点检测的正确率且具有一定的稳健性。  相似文献   

9.
传统的端点检测在信噪比较高的环境下可以有效的对语音进行端点检测,但是在低信噪比环境下端点检测的正确率急剧下降。针对在低信噪比环境下语音端点检测正确率不高的问题,提出一种将调制域谱减法和对数能量子带谱熵相结合的的端点检测算法。该算法首先利用调制域谱减法去除带噪语音的噪声以提高语音信号的信噪比,然后结合对数能量和子带谱熵算法对消噪后的语音信号进行端点检测。实验仿真结果表明,该算法在低信噪比环境下能有效提高语音端点检测的正确率且具有一定的稳健性。  相似文献   

10.
一种新的对数能量谱熵语音端点检测方法   总被引:1,自引:0,他引:1  
将一种新的对数能量(LE)特征和谱熵(SE)特征相结合,提出一种新的对数能量谱熵(LESE)特征,采用模糊C均值聚类算法和贝叶斯信息准则算法进行LESE特征门限估计,并使用双门限法进行语音端点检测.在TIMIT连续语音库上的实验结果表明,相比于能量谱熵(EE)法和对数能量(LE)法,在噪声环境下LESE法具有更好的检测性能,表现出更好的稳健性.当信噪比为-5 dB时,LESE法的检测错误率仅为18.02%,在信噪比为0~10 dB时,其检测错误率要明显低于EE法和LE法.  相似文献   

11.
语音端点检测是语音识别中非常重要的部分,识别率高低很大程度上取决于端点检测的精确程度。在高信噪比(signal-noise ratio,SNR)的实验室环境下,端点检测有很好的效果;但比如像工厂和市场等低SNR环境下,传统的检测方法性能迅速降低,端点检测无法达到预期效果。针对低SNR语音的端点检测,先通过谱减法对带噪语音进行降噪,再分别求出每帧语音信号的能量与频带方差的乘积,将乘积值作为参数进行双门限端点检测的思路,提出了一种能量和频带方差结合的端点检测方法。将TIMIT数据集中语音叠加高斯随机噪声、NOISEX 92噪声库中的factory噪声和volvo噪声进行实验。结果表明,当SNR在-10 d B时,仍有较好的检测效果,显著提高了语音端点检测的效果。  相似文献   

12.
语音端点检测(voice activity detection,VAD)是在连续语音信号中,将语音和非语言片段分离的技术。VAD在语音识别、说话人识别、语音编码等领域起着重要作用。传统VAD算法在类型已知的噪声环境下可以达到较好的性能,但在实际情况中,未知噪声的影响通常会使系统性能下降显著,在差异化噪声下的VAD是端点检测的研究难点。在总结现有语音端点检测算法基础上,提出了一种基于深度神经网络的语音端点检测方法,同时结合维特比算法,与基于贝叶斯信息准则(bayesian information criterion, BIC)的混合高斯模型(gaussian mixture model,GMM) 语音端点检测系统进行对比,在大词汇连续语音识别系统中的实验结果表明,将深度神经网络结合维特比算法,应用于语音端点检测,在复杂噪声环境下取得了更好的效果,适应性更强。  相似文献   

13.
分形理论在语音信号端点检测及增强中的应用   总被引:8,自引:1,他引:7  
为了提高现有谱相减方法处理低信噪比语音信号的效果,利用时间序列信号的短时分形维数对低信噪比语音信号的端点检测方法进行了研究,提出了一种基于端点检测的谱相减语音增强方法,给出了其原理及具体算法.仿真实验结果表明,该方法简单可靠,有效可行,当语音信号信噪比降到-5 dB时仍然有效;与已有方法相比,具有更广泛的实用性.  相似文献   

14.
一种噪声环境下的语音识别方法(线性预测误差法)的研究   总被引:4,自引:0,他引:4  
介绍一种平稳噪声环境下语音识别的新的方法。该方法利用噪声的LPC系数去预测语音信号,从而得到LPC预测序列,然后把它代替原语音序列来进行语音端点的检测、语音特征的提取和在合适的匹配方式下的识别。实验结果表明:该法在噪声环境下自动检测语音端点和提取语音信号的特征是可行的,获得了很满意的识别率。  相似文献   

15.
在噪声环境下,利用短时平均幅度为特征进行语音端点检测.文章在传统端点检测算法的基础上,研究了汉语音节的特点,提出采用短时平均幅度代替短时能量,并为平均幅度引入判决门限.门限值是根据语音信号背景噪声自动计算得到,从而保证了算法在噪声环境下检测的准确性.实验结果表明,与传统的基于短时能量的端点检测算法相比,改进的算法在高信噪比和低信噪比环境下都具有良好的性能.  相似文献   

16.
为在有色非高斯噪声背景下实时、有效地区分语音信号与各种背景噪声,提出了一种基于灰关联分析的语音激活检测(VAD)算法.该算法提取语音信号过零率、线性预测系数、倒谱系数和转移倒谱系数4种特征参数作为关联参数,通过跟踪语音与噪声灰关联度的变化确定判决门限,实现语音激活检测.仿真结果表明:该算法在无噪声背景中识别率为100%,在-5 dB噪声背景环境,识别率可达80%以上.此算法对有色非高斯背景噪声不敏感,而且计算简单、可靠性高,在语音激活检测中具有可行性.  相似文献   

17.
基于扩展谱相减与SAP的带噪语音端点检测   总被引:2,自引:0,他引:2  
为提高低信噪比时带噪语音端点检测的性能,提出了一种将扩展的谱相减法与SAP(Speech AbsenceProbab ility)软门限相结合的方法。采用基于噪声补偿结构的扩展谱相减法,通过使用自适应的判决规则,在不需要进行语音激活检测的情况下有效地去除了背景噪声,克服了单麦克输入时无法在语音段对噪声进行估计的缺点。同时采用非语音段概率SAP软门限,直接对增强后的语音信号进行检测,有效提高了语音段起止端点检测的精确度和可靠性。实验结果表明,该方法比短时能量方法的计算效率高,在信噪比为-10 dB时仍能完成端点检测。  相似文献   

18.
一种改进的基于子带谱熵的语音激活检测方法   总被引:2,自引:2,他引:0  
语音信号的激活检测(voice activity detection,VAD)是变速率语音编码的关键技术,用来检测通信时是否有语音片存在.在有噪环境下对语音信号的激活检测是非常重要而困难的.对传统子带谱熵算法进行了改进,提出了一种能够用于语音激活检测的新算法.该算法利用语音谱熵和噪声谱熵分布的不同,将信号的数字特征(方差、均值等)与传统子带谱熵相结合,用于区分语音段和非语音段.计算机仿真结果表明,在高斯白噪声环境下,改进后的子带谱熵算法能很好地区分说话人的语音段和非语音段,在某种程度上解决了传统语音激活检测算法结构复杂、参数难调、易受噪声影响等问题.  相似文献   

19.
基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。  相似文献   

20.
针对语音端点检测在一般噪音环境下易受影响,且能降低智能轮椅的语音识别率,提出了短时能量与倒谱距离相结合的语音端点检测方法.实验表明,该方法能提高整个语音识别系统的鲁棒性,通过语音识别控制轮椅的5个基本动作(前进、后退、左转、右转、停止)实现了智能轮椅运动的语音控制.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号