首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
端点检测的准确性在某种程度上直接决定了整个语音识别系统的成败,没有足够准确的端点检测(尤其是起点),精密优选特征类型或识别方法的工作往往劳而无功.噪声环境下语音识别的端点检测技术利用语音信号的倒谱特征作为判决抽样信号帧是否为语音信号的依据,并提出了倒谱距离测量法、基于隐马尔柯夫模型(HMM)的检测法.通过对两种宽带噪声(白噪声和汽车噪声)环境下信噪比从0dB到15dB的带噪语音信号进行的仿真实验结果表明,发现倒谱特征参数的语音信号端点检测方法在噪声环境下具有更强的适应性,更适合于实际的语音处理系统.  相似文献   

2.
针对固定门限方法在语音端点检测技术中的局限性,为了提高低信噪比下语音端点检测的鲁棒性和准确率,将自适应门限应用于分形维数的语音检测中,提出了一种新的语音端点检测算法.该算法通过对语音信号产生机制的分析,将分形维数用于语音起止点的检测中,设计了自适应门限,从而有效降低了噪声干扰对检测结果的影响,并实现了实时检测.仿真实验结果表明,在低信噪比的情况下,改进的端点检测算法比传统的短时能量检测算法可更准确有效地实现带噪语音的端点检测,而且对噪声干扰具有更好的鲁棒性.  相似文献   

3.
传统的语音端点检测方法以信号的短时能量、过零率等简单特征作为判决特征参数.这些方法在实际应用中,尤其当信号信噪比比较低时,无法满足系统的需要.文中利用语音信号的倒谱特征作为判决抽样信号帧是否为语音信号的依据,并提出了倒谱距离测量法和循环神经网络法.通过对宽带噪声-白噪声干扰情况和一种特殊噪声——汽车噪声情况的实验,发现倒谱特征参数的语音信号端点检测方法在噪声环境下具有传统的能量方法无法比拟的优越性,更适合于实际应用.  相似文献   

4.
低信噪比环境下语音信号的端点检测在语音识别与通信等领域具有重要意义,目前低信噪比环境下的端点检测还存在效率低、识别率不高等问题.本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相加(MFCC_a),再与短时能量相除(梅尔能量比)作为语音特征参数的语音端点检测测度,最后利用模糊C均值聚类算法自适应确定双门限阈值进行端点检测.选取TIMIT语音库中的50条语音信号进行实验,结果表明:在信噪比为5 dB、0 dB、-5 dB的噪声环境下,与能零比、谱熵等算法相比,本算法端点识别准确率均有所提高,其中在-5 dB信噪比环境下提升了约30%.  相似文献   

5.
提出了一种利用加权Mel倒谱提取语音信号共振峰的算法.首先对短时语音信号进行加权Mel倒谱分析,获得包含频谱主要成分的加权Mel倒谱系数;然后利用离散余弦平滑算法,从加权Mel倒谱系数获得谱包络,并从谱包络的峰值位置获得候选共振峰;最后根据共振峰的连续性约束条件和频率范围,从候选共振峰筛选得到共振峰的估计值.实验结果表明,本算法比倒谱法提取的共振峰误差更小,在噪声环境下具有较好的鲁棒性.  相似文献   

6.
本文主要在介绍语音端点检测的基本步骤和Mel倒谱距离、信息熵两种非时域端点检测算法,在此基础上利用Matlab软件实现这两种语音端点检测算法,并根据仿真结果比较分析,总结出Mel倒谱距离和信息熵两种非时域端点检测算法的特性。  相似文献   

7.
应用倒谱特征的带噪语音端点检测方法   总被引:7,自引:0,他引:7  
传统的语音端点检测方法以信号的短时能量、过零率等简单特征为判决特征参数。这些方法在实际应用中,尤其当信号噪比比较低时,无法满足系统的需要。文中利用语音信号的倒谱特征作为判决抽样信号帧是否为语音信号的依据,并提出了倒谱距离测量法和循环神经网络法,通过对宽带噪声-白噪声干扰情况和一种特殊噪声-汽车噪声情况的实验,发现倒谱特征参数的语音信号端点检测方法在噪声环境下具有传统的能量方法无法比拟的优越性,更适  相似文献   

8.
基于子带能量线性映射的噪声中端点检测算法   总被引:8,自引:0,他引:8  
研究噪声环境下的语音端点检测问题。在低信噪比下 ,虽然噪声和语音的频谱分布不同 ,但是传统语音检测算法使用的时域能量没有描述能量在各频域子带的分布 ,对于语音和噪声没有很好的区分性。以前提出的基于时间 -频率的能量参数利用频域的限带能量加上时域能量来进行噪声中的语音检测。但是它们选择频带的依据是语音信号的高能量子带 ,而没有考虑噪声的子带能量分布。该文提出的语音检测方法同时考虑语音和噪声的频域能量分布 ,采用线性映射的方法将 Mel滤波器组的子带能量特征空间映射到噪声和语音最有区分性的一维子空间 ,得到新的特征参数 EL MBE进行语音检测。实验结果表明 ,在噪声环境下基于线性映射的能量参数比时域能量 ,基于时间 -频率的能量有更好语音检测性能。  相似文献   

9.
张开生  赵小芬  王泽  宋帆 《科学技术与工程》2020,20(35):14536-14542
针对复杂环境下语音端点检测准确率低下且检测耗时过长的问题,研究一种基于EEMD和OS-DL联合去噪的语音端点检测算法。首先利用EEMD(总体平均经验模态分解)算法对输入语音进行分解得到IMF(本征模式分量),然后使用OS-DL(一步式字典)算法分别对纯净语音信号与噪声信号进行训练,得到纯净语音信号和噪声信号的幅度谱字典,进而对幅度谱进行稀疏表示,利用得到的系数矩阵重新构建出语音信号频谱,将重构出的语音信号频谱经过傅里叶逆变换得到降噪后的语音信号,最后对降噪后的语音信号利用均匀子带频带方差法进行端点检测。实验结果表明:该算法在复杂环境信噪比低于-10dB情况下检测准确率仍可达到85%以上,且平均检测时间缩短至传统端点检测算法的1/3。  相似文献   

10.
李明 《科技资讯》2011,(10):26-27
提出了一种时频结合的带噪语音端点检测方法。选取时域短时能量和频域熵构成一个新的特征,采用自适应门限进行端点检测。实验结果表明该方法在低信噪比环境下较传统方法提高了端点检测的准确率,鲁棒性较好。  相似文献   

11.
基于倒谱距离的语音端点检测改进算法   总被引:5,自引:1,他引:5       下载免费PDF全文
在讨论传统倒谱距离语音端点检测算法不足的基础上,提出了一种改进方案,该方法首先估计短时信噪比,然后由统计方法确定短时信噪比与门限的关系,进而完成正确的语音端点判决。通过对3种典型噪声环境下信噪比从-5 dB到20 dB的带噪语音信号进行的仿真实验结果表明,所提方法能更为准确地检测到语音端点。  相似文献   

12.
基于分频段ABAP谱减法的鸟叫声分类研究   总被引:1,自引:0,他引:1  
针对带噪鸟叫声,用自适应Bartlett平均周期图(ABAP)完成噪声估计,进行分频段谱减去噪后,提取经过二维离散余弦变换的Mel频率倒谱系数动态声音特征(TDMFCC).最后,利用支持向量机(SVM)分别结合MFCC、TDMFCC以及经过分频段ABAP谱减法降噪后的MFCC和TDMFCC对30种鸟叫声进行不同背景环境和信噪比情况下的对比实验.结果表明,分频段ABAP谱减法降噪后提取TDMFCC结合SVM的方法可以取得较好的分类效果,适用于噪声环境下的鸟叫声分类.  相似文献   

13.
传统的端点检测在信噪比较高的环境下可以有效的对语音进行端点检测,但是在低信噪比环境下端点检测的正确率急剧下降。针对在低信噪比环境下语音端点检测正确率不高的问题,提出一种将调制域谱减法和对数能量子带谱熵相结合的的端点检测算法。该算法首先利用调制域谱减法去除带噪语音的噪声以提高语音信号的信噪比,然后结合对数能量和子带谱熵算法对消噪后的语音信号进行端点检测。实验仿真结果表明,该算法在低信噪比环境下能有效提高语音端点检测的正确率且具有一定的稳健性。  相似文献   

14.
基于传统特征的行车声音端点检测法存在重叠有车段识别率低、双门限阈值较难确定的问题,针对这两个问题,探索性地将梅尔频率倒谱系数(Mel frequency cepstral coefficients,MFCC)倒谱距离特征和短时能量特征进行了融合并应用于交通量检测。首先选取了周围环境较为安静的一个双车道路段,并采集了该路段上包含重叠有车段的行车声音;其次提取了行车声音的短时能量特征和MFCC倒谱距离特征,并对它们在端点检测中的优劣进行了分析对比;再次提出了一种融合短时能量特征和MFCC倒谱距离特征的新特征,并基于新特征将传统的双门限判决思路改进成了单门限判决思路;最后利用新特征对有车段进行端点检测并统计交通量。实验结果表明:基于融合特征的端点检测方法能有效解决重叠有车段识别率低和双门限阈值较难确定的问题。  相似文献   

15.
传统的端点检测在信噪比较高的环境下可以有效地对语音进行端点检测,但是在低信噪比环境下端点检测的正确率急剧下降。针对在低信噪比环境下语音端点检测正确率不高的问题,提出一种将调制域谱减法和对数能量子带谱熵相结合的的端点检测算法;该算法首先利用调制域谱减法去除带噪语音的噪声以提高语音信号的信噪比,然后结合对数能量和子带谱熵算法对消噪后的语音信号进行端点检测。实验仿真结果表明,该算法在低信噪比环境下能有效提高语音端点检测的正确率且具有一定的稳健性。  相似文献   

16.
根据压缩感知理论,文中分析了基于压缩感知观测序列语音能量估计的理论基础,并对不同压缩比下语音能量估计的准确度仿真结果做对比,然后将得到的语音能量估计做为语音端点检测的基础,分别对粉红噪声、高斯噪声和汽车噪声情况下不同信噪比的语音进行端点检测,并与基于压缩感知观测序列倒谱距离、传统的奈奎斯特采样中能量的语音端点检测方法做对比,减少了计算量.  相似文献   

17.
基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。  相似文献   

18.
低信噪比下基于谱熵的语音端点检测算法   总被引:14,自引:0,他引:14  
为提高语音端点检测系统在低信噪(0 dB以下)下检测的准确率,提出了一种基于谱熵的端点检测算法。将每帧信号分为16个子带,选取频谱分布在250~3.5 kH z并且能量不超过该帧总能量90%的子带,计算经过语音增强后的子带能量以及各子带信噪比,根据各子带信噪比的不同调整其在整个谱熵计算过程中的权重,然后平滑谱熵,以最终的谱熵作为端点检测的依据。实验结果表明,此方法在较低的信噪比下能够显著地提高端点检测的准确率。对坦克噪声,检测效果明显优于G.729中的端点检测算法,即使在-5 dB的信噪比下,仍然可以达到95%以上的检测率。  相似文献   

19.
针对噪声环境下语音识别系统性能下降的问题,提出一种基于语音时频相关性的Mel特征矢量聚类补偿算法。该算法首先实现掩码估计,利用纯净语音信号时域和频域的相关性,实现了时频块的有效划分和基于时频块的语音特征聚类。在此基础上,对带噪语音的Mel语谱进行特征补偿。采用HTK工具和TIDIGITS数据库加入不同类别噪声的语音测试结果表明:该算法在不同信噪比条件下,获得了较基于频域相关性聚类特征补偿算法更好的性能。  相似文献   

20.
一种噪声环境下的语音识别方法(线性预测误差法)的研究   总被引:4,自引:0,他引:4  
介绍一种平稳噪声环境下语音识别的新的方法。该方法利用噪声的LPC系数去预测语音信号,从而得到LPC预测序列,然后把它代替原语音序列来进行语音端点的检测、语音特征的提取和在合适的匹配方式下的识别。实验结果表明:该法在噪声环境下自动检测语音端点和提取语音信号的特征是可行的,获得了很满意的识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号