首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
提出了一种能够提高ITU-TG.729算法性能的静音检测技术,该技术的引入不仅可以降低G.729的语音通讯平均传输出特率,而且可以大量节省G.729压缩和解压过程的实际运算量,通过在不同的噪声背景下的性能分析,该静音检测技术的引入不会对G.729算法的合成语音质量产生明显的影响。  相似文献   

2.
基于DSP实现语音端点检测   总被引:1,自引:0,他引:1  
介绍了一种以DSP芯片为核心的语音端点检测模块,用于有线/无线自动转接设备。该模块的语音端点检测算法应用短时能量、短时过零率和短时自相关语音特征参量进行联合检测,达到了比较满意的端点检测效果。该模块应用于系统中能够实现通话方语音对通话过程的自动控制。  相似文献   

3.
基于语音信号短时平稳性以及语音信号和噪声的统计模型,提出了一种语音信号有声/无声的检测方法。该方法可对所有语音短时帧更新噪声参数的估值,因而提高了检测的准确性,根据噪声参数以及语音和噪声的统计特性定义了似然比,确定了有声/无声的判别准则,研究了判别阈值、平滑因子等参数以及缓变非平稳背景噪声对检测结果的影响。实验结果表明,即使背景噪声具有缓变特性,利用该方法仍可得到良好的检测结果。对不同的应用,在检测过程中判别阈值的选取应结合平滑因子进行必要的优化。  相似文献   

4.
语音端点检测(voice activity detection,VAD)是在连续语音信号中,将语音和非语言片段分离的技术。VAD在语音识别、说话人识别、语音编码等领域起着重要作用。传统VAD算法在类型已知的噪声环境下可以达到较好的性能,但在实际情况中,未知噪声的影响通常会使系统性能下降显著,在差异化噪声下的VAD是端点检测的研究难点。在总结现有语音端点检测算法基础上,提出了一种基于深度神经网络的语音端点检测方法,同时结合维特比算法,与基于贝叶斯信息准则(bayesian information criterion, BIC)的混合高斯模型(gaussian mixture model,GMM) 语音端点检测系统进行对比,在大词汇连续语音识别系统中的实验结果表明,将深度神经网络结合维特比算法,应用于语音端点检测,在复杂噪声环境下取得了更好的效果,适应性更强。  相似文献   

5.
对数字化语音减速播放涉及的若干技术问题进行了研究,为了保证语调不变,提出了一种插值算法,并对传统的基音检测算法进行改进,在不降低计算精度的前提下大幅度地缩减了计算量,实验结果表明,算法既保证了语音质量,又有良好的实时性。  相似文献   

6.
针对语音激活检测的鲁棒性问题,提出在非平稳噪声环境下使用基于复高斯混合模型的鲁棒语音激活检测算法.算法中假设纯净语音谱满足复高斯混合模型,先验信噪比利用预先训练好的复高斯混合模型计算得到.复高斯混合模型的引入一方面提高了语音激活检测的性能,另一方面避免了使用基于最小均方误差语音增强的先验信噪比估计过程.实验中使用NOISEX-92噪声库来验证系统在噪声环境下的性能.结果表明,该种算法在非平稳噪声环境下具有良好的检测性能.  相似文献   

7.
一种基于噪声动态检测的语音端点检测算法   总被引:1,自引:0,他引:1  
HMM技术在语音识别中得到较为成功的应用.本文基于HMM的孤立词语音识别系统的识别策略,提出了两个改进的算法.第一种算法是对背景噪声进行动态估计的汉语语音端点检测算法,较一些常规的端点检测方法如基于能量的端点检测方法,具有更高精度和鲁棒性,第二种算法针对分裂法进行码本设计时,可能出现除数为零的计算错误,提出了避免出现计算错误的改进算法.通过进行汉语孤立词语音识别实验,表明这两种算法是有效的,得到较高的识别率.  相似文献   

8.
蔡柳  赵晨星 《甘肃科技》2008,24(5):46-48
随着对安多藏语语音识别技术的研究,端点检测发挥着重要的作用,准确的判断语音端点对识别性能有很大的影响。引用了双门限检测法对藏语语音进行端点检测实验,在实验中对短时平均过零率进行修正,克服了随机噪音的影响,取得了较好的效果。  相似文献   

9.
为降低噪声对语音通信的干扰,提出了一种基于谱减的语音增强算法的改进方法。根据噪声频谱的G auss统计模型修正语音增强过程中噪声频谱的估计方法,利用帧内、帧间约束估计每一个频点的先验信噪比,提出了一种简便的估计语音在每一个频点出现的概率的方法,得出了修正的语音增强算法。在白噪声以及坦克噪声环境中分别对算法的性能进行测试。实验结果表明:在几乎不损伤语音清晰度的前提下,该算法使“音乐噪声”得到了更好的抑制,同时信噪比提高了约8 dB以上。  相似文献   

10.
针对加性有色噪声干扰,提出了一种单通道输入基于信号子空间的话音增强算法。算法中使用自适应的方法跟踪KLT(Karhunen—Loeve Transform)阵。运用一种近似模型来表述有色噪声的特性,并基于噪声平稳的假设,通过采用预处理技术的语音活动性检测(VAD:Voice Activity Detection)单元获取噪声样本,用于下一语音帧中噪声特性的估计和增强处理。实验表明,算法对于有色噪声干扰下的语音信号有较好的增强效果,并且性能优于改进减谱法。  相似文献   

11.
为在有色非高斯噪声背景下实时、有效地区分语音信号与各种背景噪声,提出了一种基于灰关联分析的语音激活检测(VAD)算法.该算法提取语音信号过零率、线性预测系数、倒谱系数和转移倒谱系数4种特征参数作为关联参数,通过跟踪语音与噪声灰关联度的变化确定判决门限,实现语音激活检测.仿真结果表明:该算法在无噪声背景中识别率为100%,在-5 dB噪声背景环境,识别率可达80%以上.此算法对有色非高斯背景噪声不敏感,而且计算简单、可靠性高,在语音激活检测中具有可行性.  相似文献   

12.
在语音信号处理系统中,基于帧能量的语音端点检测(voiceactivitydetection,VAD)往往受到语音段能量不平稳及噪声的影响,为了提高语音端点检测的性能和鲁棒性,引入视觉信息。该文提出采用基于数据驱动的线性变换生成视觉特征,在提出一个基于统计的VAD一般模型的基础上构建两个单模式的VAD系统,通过两步式的融合方法,得到了多模式的VAD系统。实验表明:同时利用音频和视觉信息的多模式VAD比基于帧能量的听觉VAD在帧错误率上有55.0%的相对下降,在断句错误率上有98.5%的相对下降。这一结果说明多模式VAD方法基本可以避免断句错误,也能够显著改善帧检测性能,是一种相当有效的方法。  相似文献   

13.
3G系统中复杂背景噪声环境下话音激活检测算法性能分析   总被引:1,自引:1,他引:0  
以第三代移动通信合作项目组(3GPP)和欧洲电信标准委员会(ETSI)SGM相关标准为依据,分析自适应多速率语音编码器中话音激活检测算法在不同背景噪声和不同输入信噪比下的性能,基于对大量实验室结果的分析,对其在3G系统中应用的鲁棒性加以验证,同时和国际电联电信标准组(ITU-T)建议的G.729算法进行比较,研究表明,该算法在非平衡背景噪声环境下的成于G.729,在保证重构语音足够高可懂度和自然度的前提下,使整个移动通信系统容量增加约30%。  相似文献   

14.
单工电台接入有线电话网在军事和民用上都有很大的需求,在设计中面临着两个问题,一是有线端二/四转换引入的回波影响,二是话音检测,传统的方案采取自适应顺波抵消技术来解决第一问题,提出了一种基于可靠的话音检测,通过交换控制软件来实现的接入方案,其回顾了自适应回波抵消这一难题,具有软,硬件代价低的优点,该设计方案现已应用于实际的产品中,性能良好。  相似文献   

15.
基于支持向量机与多观测复合特征矢量的语音端点检测   总被引:1,自引:0,他引:1  
该文提出了一种新的多观测复合特征(MO-CF)用于基于支持向量机(SVM)的语音端点检测(VAD)。该特征是由2个子特征经平衡因子加权构成。特征的优化目标是寻找能使VAD的性能曲线下面积(AUC)最大化的平衡因子,以综合各个子特征的优点。在子特征选择方面,要求各个子特征不仅本身具有较好的性能,而且存在互补性。针对该要求,提出2种组合特征MO-CF1和MO-CF2。由多观测信噪比(MO-SNR)特征与多观测最大概率(MO-MP)特征复合而成的MO-CF2比MO-CF1更稳健。实验结果表明:在多种噪声环境下,相比于已有的9种VAD算法,该算法具有更好的性能和更高的稳健性。  相似文献   

16.
针对传统谱相减法所带来的噪声谱估计不能及时更新和"音乐噪声"比较明显等问题,引入了话音激活检测,设计了新的检测方法.在传统的谱减运算基础上增加了平滑运算,提出了一种新的基于改进的谱相减法--谱减平滑算法的语音窄带干扰抑制技术,并对传统算法和新算法进行仿真比较.结果表明,新算法较好地解决了传统算法存在的问题,比传统算法有更优的频谱特性、更高的输出信噪比和更好的听觉性能.  相似文献   

17.
针对小体积应用场合下的语音增强,提出了一种基于等边三角形结构的麦克风阵列与Wiener后置滤波相结合,并由VAD作为控制单元的语音增强方法。该方法克服了自适应零限波束形成只能抑制空间相干噪声的缺点,并得到可在二维平面上旋转的波束主瓣。通过仿真和真实环境的实验,证明算法能够显著地提高输入语音信噪比,且适用于多种噪声场。  相似文献   

18.
语音信号的激活检测(voice activity detection,VAD)是变速率语音编码的关键技术,用来检测通信时是否有语音片存在。在有噪环境下对语音信号的激活检测是非常重要而困难的。对传统子带谱熵算法进行了改进,提出了一种能够用于语音激活检测的新算法。该算法利用语音谱熵和噪声谱熵分布的不同,将信号的数字特征(方差、均值等)与传统子带谱熵相结合,用于区分语音段和非语音段。计算机仿真结果表明,在高斯白噪声环境下,改进后的子带谱熵算法能很好地区分说话人的语音段和非语音段,在某种程度上解决了传统语音激活检测算法结构复杂、参数难调、易受噪声影响等问题。  相似文献   

19.
低信噪比下基于谱熵的语音端点检测算法   总被引:14,自引:0,他引:14  
为提高语音端点检测系统在低信噪(0 dB以下)下检测的准确率,提出了一种基于谱熵的端点检测算法。将每帧信号分为16个子带,选取频谱分布在250~3.5 kH z并且能量不超过该帧总能量90%的子带,计算经过语音增强后的子带能量以及各子带信噪比,根据各子带信噪比的不同调整其在整个谱熵计算过程中的权重,然后平滑谱熵,以最终的谱熵作为端点检测的依据。实验结果表明,此方法在较低的信噪比下能够显著地提高端点检测的准确率。对坦克噪声,检测效果明显优于G.729中的端点检测算法,即使在-5 dB的信噪比下,仍然可以达到95%以上的检测率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号