首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 78 毫秒
1.
语音信号的激活检测(voice activity detection,VAD)是变速率语音编码的关键技术,用来检测通信时是否有语音片存在.在有噪环境下对语音信号的激活检测是非常重要而困难的.对传统子带谱熵算法进行了改进,提出了一种能够用于语音激活检测的新算法.该算法利用语音谱熵和噪声谱熵分布的不同,将信号的数字特征(方差、均值等)与传统子带谱熵相结合,用于区分语音段和非语音段.计算机仿真结果表明,在高斯白噪声环境下,改进后的子带谱熵算法能很好地区分说话人的语音段和非语音段,在某种程度上解决了传统语音激活检测算法结构复杂、参数难调、易受噪声影响等问题.  相似文献   

2.
语音信号的激活检测(voice activity detection,VAD)是变速率语音编码的关键技术,用来检测通信时是否有语音片存在。在有噪环境下对语音信号的激活检测是非常重要而困难的。对传统子带谱熵算法进行了改进,提出了一种能够用于语音激活检测的新算法。该算法利用语音谱熵和噪声谱熵分布的不同,将信号的数字特征(方差、均值等)与传统子带谱熵相结合,用于区分语音段和非语音段。计算机仿真结果表明,在高斯白噪声环境下,改进后的子带谱熵算法能很好地区分说话人的语音段和非语音段,在某种程度上解决了传统语音激活检测算法结构复杂、参数难调、易受噪声影响等问题。  相似文献   

3.
为在有色非高斯噪声背景下实时、有效地区分语音信号与各种背景噪声,提出了一种基于灰关联分析的语音激活检测(VAD)算法.该算法提取语音信号过零率、线性预测系数、倒谱系数和转移倒谱系数4种特征参数作为关联参数,通过跟踪语音与噪声灰关联度的变化确定判决门限,实现语音激活检测.仿真结果表明:该算法在无噪声背景中识别率为100%,在-5 dB噪声背景环境,识别率可达80%以上.此算法对有色非高斯背景噪声不敏感,而且计算简单、可靠性高,在语音激活检测中具有可行性.  相似文献   

4.
文章涉及了语音编码中最新的一种编码方式——变速率语音编码。语音激活检测 (VAD)算法是其中的关键部分 ,直接影响语音质量和试听效果。文章通过分析国际电信联盟的 G.72 9B标准 ,提出了一种适用于三速率语音编码方式的VA D算法。该算法结合了声学分类 ,对噪声、清音和浊音加以区分 ,最后给出了仿真结果 ,证明其稳健性和有效性  相似文献   

5.
基于小波变换的语音激活检测   总被引:4,自引:0,他引:4  
为了提高语音激活检测在多种噪声环境下的检测性能,基于语音与噪声相区别的主要特征,提出了一种基于小波变换的语音激活检测算法.算法将信号频带划分为多个子带,提出用归一化谱分布向量表征信号的谱分布特性,利用小波检测信号分形特征的能力,提出用信号的自相关指数来表征信号的自相关性,结合归一化谱分布向量的线性加权和自相关指数两个因素得出新的激活检测判决准则.实验仿真结果与ITU标准G.729和ETSI标准AMR2中的检测性能进行了分析比较.结果表明,该算法在多种噪声环境下都具有较高的准确率和稳定性.  相似文献   

6.
一种基于马可夫过程统计模型的语音激活检测方法   总被引:3,自引:0,他引:3       下载免费PDF全文
根据语音的特点,以一阶马可夫过程统计模型对语音进行建模,并在此基础上对语音的激活检测进行了性能分析。在方案的实现过程中,采用了多种平滑因子,进一步改进了语音判决的正确性。与通常所用的检测方法相比,在性能上有了一定程度的提高。  相似文献   

7.
在噪声环境下,利用短时平均幅度为特征进行语音端点检测.文章在传统端点检测算法的基础上,研究了汉语音节的特点,提出采用短时平均幅度代替短时能量,并为平均幅度引入判决门限.门限值是根据语音信号背景噪声自动计算得到,从而保证了算法在噪声环境下检测的准确性.实验结果表明,与传统的基于短时能量的端点检测算法相比,改进的算法在高信噪比和低信噪比环境下都具有良好的性能.  相似文献   

8.
低信噪比下基于谱熵的语音端点检测算法   总被引:14,自引:0,他引:14  
为提高语音端点检测系统在低信噪(0 dB以下)下检测的准确率,提出了一种基于谱熵的端点检测算法。将每帧信号分为16个子带,选取频谱分布在250~3.5 kH z并且能量不超过该帧总能量90%的子带,计算经过语音增强后的子带能量以及各子带信噪比,根据各子带信噪比的不同调整其在整个谱熵计算过程中的权重,然后平滑谱熵,以最终的谱熵作为端点检测的依据。实验结果表明,此方法在较低的信噪比下能够显著地提高端点检测的准确率。对坦克噪声,检测效果明显优于G.729中的端点检测算法,即使在-5 dB的信噪比下,仍然可以达到95%以上的检测率。  相似文献   

9.
通过对接收信号样本偏度和样本峰度进行归一化处理,设计了一种基于偏度和峰度联合检测的频谱感知算法(联合检测算法).利用卡方分布的概率密度函数分析非渐近条件下算法的理论虚警性能,推导出相应的理论判决门限.仿真实验结果表明,联合检测算法在小样本条件下仍然可以保证可靠的检测结果,并表现出比经典的Jarque-Bera频谱感知算法更优的检测性能.  相似文献   

10.
针对现有的基于相似性检测的语音基频估计算法难以达到实时效果的缺点,提出了一种基于多层次相似检测机制的语音基频估计算法,该算法实时性好,易于硬件实现。  相似文献   

11.
在语音信号处理系统中,基于帧能量的语音端点检测(voiceactivitydetection,VAD)往往受到语音段能量不平稳及噪声的影响,为了提高语音端点检测的性能和鲁棒性,引入视觉信息。该文提出采用基于数据驱动的线性变换生成视觉特征,在提出一个基于统计的VAD一般模型的基础上构建两个单模式的VAD系统,通过两步式的融合方法,得到了多模式的VAD系统。实验表明:同时利用音频和视觉信息的多模式VAD比基于帧能量的听觉VAD在帧错误率上有55.0%的相对下降,在断句错误率上有98.5%的相对下降。这一结果说明多模式VAD方法基本可以避免断句错误,也能够显著改善帧检测性能,是一种相当有效的方法。  相似文献   

12.
为降低噪声对语音通信的干扰,提出了一种基于谱减的语音增强算法的改进方法。根据噪声频谱的G auss统计模型修正语音增强过程中噪声频谱的估计方法,利用帧内、帧间约束估计每一个频点的先验信噪比,提出了一种简便的估计语音在每一个频点出现的概率的方法,得出了修正的语音增强算法。在白噪声以及坦克噪声环境中分别对算法的性能进行测试。实验结果表明:在几乎不损伤语音清晰度的前提下,该算法使“音乐噪声”得到了更好的抑制,同时信噪比提高了约8 dB以上。  相似文献   

13.
语音信号的谱熵检测在车辆通信中的应用   总被引:2,自引:0,他引:2  
结合车辆通信中语音信号的特殊性, 利用傅里叶变换和最大离散熵定理, 对含强噪语音的短时频谱进行分析, 构造出一种熵函数来对语音信号进行语音/噪声的判决. 以一段语音信号为例进行仿真, 研究结果表明, 谱熵检测方法计算简单, 谱熵值和隔离度较大, 具有稳健的抗噪特性, 可以应用于车辆通信中语音信号的检测.  相似文献   

14.
为提高实时通信中语音端点检测系统的性能,提出了一种基于能量和鉴别信息的端点检测算法。该算法利用帧信号的能量、子带信号的能量等参数,计算该帧信号与噪声帧基于子带能量分布概率的鉴别信息。算法通过利用鉴别信息,能够在包括语音帧在内的所有帧中更新噪声的能量,从而更准确地跟踪噪声能量的变化。实验结果表明:与基于能量的端点检测算法相比,该方法在信噪比变化比较剧烈的情况下仍然能够较准确地进行端点检测,在0~10 dB范围内变化的坦克噪声环境中,准确率比后者提高约24%。  相似文献   

15.
16.
语音端点检测(voice activity detection,VAD)是在连续语音信号中,将语音和非语言片段分离的技术。VAD在语音识别、说话人识别、语音编码等领域起着重要作用。传统VAD算法在类型已知的噪声环境下可以达到较好的性能,但在实际情况中,未知噪声的影响通常会使系统性能下降显著,在差异化噪声下的VAD是端点检测的研究难点。在总结现有语音端点检测算法基础上,提出了一种基于深度神经网络的语音端点检测方法,同时结合维特比算法,与基于贝叶斯信息准则(bayesian information criterion, BIC)的混合高斯模型(gaussian mixture model,GMM) 语音端点检测系统进行对比,在大词汇连续语音识别系统中的实验结果表明,将深度神经网络结合维特比算法,应用于语音端点检测,在复杂噪声环境下取得了更好的效果,适应性更强。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号