期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李文洁张晴晴张鹏远颜永红摆亮《重庆邮电大学学报(自然科学版)》2018,30(2):210-215

语音端点检测(voice activity detection,VAD)是在连续语音信号中,将语音和非语言片段分离的技术。VAD在语音识别、说话人识别、语音编码等领域起着重要作用。传统VAD算法在类型已知的噪声环境下可以达到较好的性能,但在实际情况中,未知噪声的影响通常会使系统性能下降显著,在差异化噪声下的VAD是端点检测的研究难点。在总结现有语音端点检测算法基础上,提出了一种基于深度神经网络的语音端点检测方法,同时结合维特比算法,与基于贝叶斯信息准则(bayesian information criterion, BIC)的混合高斯模型(gaussian mixture model,GMM) 语音端点检测系统进行对比,在大词汇连续语音识别系统中的实验结果表明,将深度神经网络结合维特比算法,应用于语音端点检测,在复杂噪声环境下取得了更好的效果,适应性更强。相似文献

2.

基于DNN-LSTM的VAD算法

张雪英牛溥华高帆《清华大学学报(自然科学版)》2018,(5)

基于深度神经网络(deep neural network,DNN)的语音活动性检测(voice activity detection,VAD)忽略了声学特征在时间上的相关性,在带噪环境下性能会明显下降。该文提出了一种基于深度神经网络和长短时记忆单元(long-short term memory,LSTM)的混合网络结构应用于VAD问题。进一步对语音帧的动态信息加以分析利用,同时结合DNN-LSTM结构使用一种基于上下文信息的代价函数用于网络训练。实验语料基于TIDIGITS语音库,使用Noisex-92噪声库加噪。实验结果表明:在不同噪声环境下基于DNN-LSTM的VAD方法比基于DNN的VAD方法性能更好,新的代价函数比传统的代价函数更适用于该文提出的算法。相似文献

3.

VAD技术反演水平风廓线的质量控制标准 总被引：2，自引：0，他引：2

邵爱梅乔小湜邱崇践《兰州大学学报(自然科学版)》2009,45(5)

基于VAD算法原理及雷达观测噪音、缺测及风场非线性程度对反演风的影响,设置了有效数据点数、数据空缺的最大间隔、相对离差、高波项能量分量四个判据来判别VAD风的可靠性.利用美国KTLX雷达2001年3月的观测资料以及邻近探空观测资料共1 895个样本的统计分析表明单个的判据对VAD风好坏的识别能力较差.但是综合四个判据可以得到较有效的VAD风质量控制标准,进而得到判断VAD风适用性的两种判断策略. 相似文献

4.

多模式语音端点检测

刘鹏王作英《清华大学学报(自然科学版)》2005,45(7):896-899

在语音信号处理系统中,基于帧能量的语音端点检测(voiceactivitydetection,VAD)往往受到语音段能量不平稳及噪声的影响,为了提高语音端点检测的性能和鲁棒性,引入视觉信息。该文提出采用基于数据驱动的线性变换生成视觉特征,在提出一个基于统计的VAD一般模型的基础上构建两个单模式的VAD系统,通过两步式的融合方法,得到了多模式的VAD系统。实验表明:同时利用音频和视觉信息的多模式VAD比基于帧能量的听觉VAD在帧错误率上有55.0%的相对下降,在断句错误率上有98.5%的相对下降。这一结果说明多模式VAD方法基本可以避免断句错误,也能够显著改善帧检测性能,是一种相当有效的方法。相似文献

5.

基于子带保留似然比的鲁棒语音激活检测算法

《华中科技大学学报(自然科学版)》2015,(11)

为了进一步提高低信噪比下语音激活检测(VAD)的准确率,针对基于统计模型的似然比检验方法容易造成非语音信号误检的问题,提出了一种基于子带保留似然比的VAD算法.在似然比综合判决准则中引入保留因子,根据人耳对语音感知敏感度在频率上的差异,采用全局非均匀、局部均匀的方式划分子带,对似然比大于阈值的频率分量所对应的子带信号提取语音特征并根据特征强度设置保留因子,只使用保留的频分量似然比进行综合判决.实验结果表明:该算法在不同的低信噪比环境下检测性能均优于LRT(似然比检验)、MO-LRT(多观测似然比检验)等算法,其漏检率更低,同时有效减少了非语音信号似然比虚高而导致的误检,VAD判决准确率平均提高了2%~14%. 相似文献

6.

基于MFCC等组合特征的说话人识别模型

朱建伟孙水发刘晓丽《三峡大学学报(自然科学版)》2009,31(6):77-79,93

为了有效提取语音特征,提高说话人识别的准确率,系统采用基于有限状态机的端点检测算法对原始语音做VAD处理,提出了新的特征组合参数：基于人的听觉特性的MFCC参数、基于发音生理特征的基音轮廓特征以及衍生的基音周期一阶差分、基音周期变化率,并将它们作为说话人识别系统的特征参数,建立了基于VQ的识别模型.实验表明：本文系统使用VAD,使系统的识别率提高了5%8%,较单独使用MFCC参数的说话人识别系统的识别率提高了2%3%. 相似文献

7.

基于支持向量机与多观测复合特征矢量的语音端点检测 总被引：1，自引：0，他引：1

张晓雷吴及吕萍《清华大学学报(自然科学版)》2011,(9):1209-1214

该文提出了一种新的多观测复合特征(MO-CF)用于基于支持向量机(SVM)的语音端点检测(VAD)。该特征是由2个子特征经平衡因子加权构成。特征的优化目标是寻找能使VAD的性能曲线下面积(AUC)最大化的平衡因子,以综合各个子特征的优点。在子特征选择方面,要求各个子特征不仅本身具有较好的性能,而且存在互补性。针对该要求,提出2种组合特征MO-CF1和MO-CF2。由多观测信噪比(MO-SNR)特征与多观测最大概率(MO-MP)特征复合而成的MO-CF2比MO-CF1更稳健。实验结果表明:在多种噪声环境下,相比于已有的9种VAD算法,该算法具有更好的性能和更高的稳健性。相似文献

8.

基于预处理VAD和自适应KLT的语音增强算法

李宏伟赵晓晖《吉林大学学报(信息科学版)》2003,21(2):117-122

针对加性有色噪声干扰，提出了一种单通道输入基于信号子空间的话音增强算法。算法中使用自适应的方法跟踪KLT(Karhunen—Loeve Transform)阵。运用一种近似模型来表述有色噪声的特性，并基于噪声平稳的假设，通过采用预处理技术的语音活动性检测(VAD：Voice Activity Detection)单元获取噪声样本，用于下一语音帧中噪声特性的估计和增强处理。实验表明，算法对于有色噪声干扰下的语音信号有较好的增强效果，并且性能优于改进减谱法。相似文献

9.

现场录音的噪声消除及其DSP实现

张承云蔡阳生吴锦铭《太原理工大学学报》2010,41(6)

为实时消除现场录音过程中的不相关平稳加性噪声,采用基于先验信噪比的谱减法语音去噪算法,对其增益因子进行了修正,提出一种简化的语音激活检测(Voice Activity Detection,VAD)算法用于噪声参数更新。总结出4条DSP实现时的优化措施,使算法运算量大大降低,方便算法的实时实现。用本方法在TMS320C6713浮点DSP上实现了两通道的语音去噪并用于一会议室的录音系统中,取得良好的噪声消除效果。相似文献

10.

一种基于灰关联分析法的语音激活检测算法

下载免费PDF全文

陈功张雄伟李耀波朱流泉《解放军理工大学学报(自然科学版)》2007,8(1):10-14

为在有色非高斯噪声背景下实时、有效地区分语音信号与各种背景噪声,提出了一种基于灰关联分析的语音激活检测(VAD)算法.该算法提取语音信号过零率、线性预测系数、倒谱系数和转移倒谱系数4种特征参数作为关联参数,通过跟踪语音与噪声灰关联度的变化确定判决门限,实现语音激活检测.仿真结果表明:该算法在无噪声背景中识别率为100%,在-5 dB噪声背景环境,识别率可达80%以上.此算法对有色非高斯背景噪声不敏感,而且计算简单、可靠性高,在语音激活检测中具有可行性. 相似文献

11.

VAD技术反演平均风向风速的研究

下载免费PDF全文

杜晓勇张鹏胡明宝《解放军理工大学学报(自然科学版)》2002,3(3):81-84

采用实测的单普勒雷达速度资料，通过对比分析了，重点讨论了非均匀分布VAD计算方法和均匀分布VAD计算方法的异同，以了解非均匀分布VAD计算方法业务应用的可能性。结果表明，在多普勒速度场缺测值较少情况下，两者计算结果接近；在多普勒速度场缺测值较多时，两者计算的平均风向和风速有较大的差别，均匀分布VAD计算的风速偏小，而非均匀分布VAD计算结果比较合理。相似文献

12.

多普勒雷达VAD技术扩展的误差分析 总被引：7，自引：0，他引：7

白洁周晓波王立琨陶祖钰《北京大学学报(自然科学版)》2001,37(1):48-54

从理论上给出了扩展VAD相对于VAD的误差解析表达式,证明谐波分析方法可从半圆资料中精确地求出一阶富氏系数,因此半圆VAD方法计算出的大尺度风向风速和VAD方法有相同的精度。用1/3圆资料拟合简谐曲线所计算出的风向风速相对于VAD方法存在误差,其大小和简谐曲线的初位相有关,风向误差为0～27°、风速相对误差为0～0.4。理想简谐分布离散数据的模拟实验表明,TVAD的风向平均误差为16°、风速为0.27,与常规测风的误差相近。实际多普勒速度廓线的拟合实验说明半圆VAD技术和TVAD技术所拟合出的简谐曲线可以反映其所代表区域的风场大尺度特征。相似文献

13.

3G系统中复杂背景噪声环境下话音激活检测算法性能分析 总被引：1，自引：1，他引：0

陈东匡镜明《北京理工大学学报》2001,21(2):232-236

以第三代移动通信合作项目组（3GPP）和欧洲电信标准委员会（ETSI）SGM相关标准为依据,分析自适应多速率语音编码器中话音激活检测算法在不同背景噪声和不同输入信噪比下的性能,基于对大量实验室结果的分析,对其在3G系统中应用的鲁棒性加以验证,同时和国际电联电信标准组（ITU－T）建议的G．729算法进行比较,研究表明,该算法在非平衡背景噪声环境下的成于G．729,在保证重构语音足够高可懂度和自然度的前提下,使整个移动通信系统容量增加约30％。相似文献

14.

一种基于马可夫过程统计模型的语音激活检测方法 总被引：3，自引：0，他引：3

下载免费PDF全文

徐筱麟张兴国《解放军理工大学学报(自然科学版)》2003,4(1):7-10

根据语音的特点，以一阶马可夫过程统计模型对语音进行建模，并在此基础上对语音的激活检测进行了性能分析。在方案的实现过程中，采用了多种平滑因子，进一步改进了语音判决的正确性。与通常所用的检测方法相比，在性能上有了一定程度的提高。相似文献

15.

一种基于声学分类的语音激活检测算法

魏涛顾涵铮《合肥工业大学学报(自然科学版)》2001,24(2):222-225

文章涉及了语音编码中最新的一种编码方式——变速率语音编码。语音激活检测 (VAD)算法是其中的关键部分 ,直接影响语音质量和试听效果。文章通过分析国际电信联盟的 G.72 9B标准 ,提出了一种适用于三速率语音编码方式的VA D算法。该算法结合了声学分类 ,对噪声、清音和浊音加以区分 ,最后给出了仿真结果 ,证明其稳健性和有效性相似文献