期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

一种改进的基于子带谱熵的语音激活检测方法 总被引：2，自引：2，他引：0

宋喆张德民张天骐《重庆邮电大学学报(自然科学版)》2009,21(6):725-730

语音信号的激活检测(voice activity detection,VAD)是变速率语音编码的关键技术,用来检测通信时是否有语音片存在.在有噪环境下对语音信号的激活检测是非常重要而困难的.对传统子带谱熵算法进行了改进,提出了一种能够用于语音激活检测的新算法.该算法利用语音谱熵和噪声谱熵分布的不同,将信号的数字特征(方差、均值等)与传统子带谱熵相结合,用于区分语音段和非语音段.计算机仿真结果表明,在高斯白噪声环境下,改进后的子带谱熵算法能很好地区分说话人的语音段和非语音段,在某种程度上解决了传统语音激活检测算法结构复杂、参数难调、易受噪声影响等问题. 相似文献

2.

基于交叉熵顺序统计滤波的语音端点检测算法 总被引：2，自引：0，他引：2

钱彦旻刘加《清华大学学报(自然科学版)》2009,(10)

为提高语音端点检测在强噪声环境下的准确率,提出了一种基于交叉熵顺序统计滤波(OSF)的语音端点检测算法。该算法以子带交叉熵为语音/非语音的区分特征,首先将每帧语音的频谱划分成若干个子带,估计出每个子带能量与背景噪声之间的交叉熵,然后把相继若干帧的子带能量交叉熵经过一组顺序统计滤波器,最后根据各帧交叉熵的值对输入的语音进行分类。实验结果表明:该算法能够有效地区分语音和非语音。特别是在强噪声环境下依然能够保持很高的检测率,具有鲁棒性。通过实验结果比较,该算法在性能上优于最近提出的基于能量顺序统计滤波和单纯交叉熵判别的两种方法。相似文献

3.

低信噪比下语音断点检测算法的改进研究

王群曾庆宁郑展恒《科学技术与工程》2017,17(21)

传统的端点检测在信噪比较高的环境下可以有效的对语音进行端点检测,但是在低信噪比环境下端点检测的正确率急剧下降。针对在低信噪比环境下语音端点检测正确率不高的问题,提出一种将调制域谱减法和对数能量子带谱熵相结合的的端点检测算法。该算法首先利用调制域谱减法去除带噪语音的噪声以提高语音信号的信噪比,然后结合对数能量和子带谱熵算法对消噪后的语音信号进行端点检测。实验仿真结果表明,该算法在低信噪比环境下能有效提高语音端点检测的正确率且具有一定的稳健性。相似文献

4.

低信噪比下语音端点检测算法的改进研究

《科学技术与工程》2017,(21)

传统的端点检测在信噪比较高的环境下可以有效地对语音进行端点检测,但是在低信噪比环境下端点检测的正确率急剧下降。针对在低信噪比环境下语音端点检测正确率不高的问题,提出一种将调制域谱减法和对数能量子带谱熵相结合的的端点检测算法;该算法首先利用调制域谱减法去除带噪语音的噪声以提高语音信号的信噪比,然后结合对数能量和子带谱熵算法对消噪后的语音信号进行端点检测。实验仿真结果表明,该算法在低信噪比环境下能有效提高语音端点检测的正确率且具有一定的稳健性。相似文献

5.

低信噪比下基于谱熵的语音端点检测算法 总被引：14，自引：0，他引：14

李晔张仁智崔慧娟唐昆《清华大学学报(自然科学版)》2005,45(10):1397-1400

为提高语音端点检测系统在低信噪(0 dB以下)下检测的准确率,提出了一种基于谱熵的端点检测算法。将每帧信号分为16个子带,选取频谱分布在250~3.5 kH z并且能量不超过该帧总能量90%的子带,计算经过语音增强后的子带能量以及各子带信噪比,根据各子带信噪比的不同调整其在整个谱熵计算过程中的权重,然后平滑谱熵,以最终的谱熵作为端点检测的依据。实验结果表明,此方法在较低的信噪比下能够显著地提高端点检测的准确率。对坦克噪声,检测效果明显优于G.729中的端点检测算法,即使在-5 dB的信噪比下,仍然可以达到95%以上的检测率。相似文献

6.

一种基于幅度谱偏度的语音激活检测算法

李强陈丁当舒勤军《重庆邮电大学学报(自然科学版)》2015,27(6):728-734

根据语音信号偏离高斯分布程度大而背景噪声信号偏离高斯分布程度小这一特征,提出一种改进的以语音短时幅度谱偏度为特征参数区分语音段和噪声段的语音激活检测算法,并应用到2.4 kbit/s混合激励线性预测(mixed excitation linear prediction,MELP)声码器中.通过与自适应多速率(adaptive multi-rate,AMR)语音编码标准中的语音激活检测算法相比较,该算法复杂度较小,且对背景噪声服从高斯分布的语音信号具有更好的端点检测性能.实现了可变速率MELP声码器的平均输出码率下降为1.9 kbit/s,通过非连续传输后合成的语音具有良好的舒适性和连续性. 相似文献

7.

噪声环境下多特征融合的语音端点检测方法

《云南大学学报(自然科学版)》2021,(4)

针对传统语音端点检测方法在噪声环境下鲁棒性较差以及对语音段检测效果不佳的问题,提出一种多特征融合的语音端点检测方法.首先,提取带噪语音信号的子带谱熵特征和基于Mel频率倒谱系数(Mel Frequency Cepstral Coefficient, MFCC)的投影特征,并将Gammatone频率倒谱系数的第一维系数GFCC0特征应用到语音端点检测任务中;然后,对3类特征进行自适应加权融合,得到适用于端点检测的融合特征;最后,采用模糊C均值聚类自适应估计门限阈值,再通过双门限法得到端点检测的结果.所提方法和已有传统方法相比,在7种噪声环境下均取得了更好的端点检测结果,提升了语音端点检测的准确率,特别是在volvo噪声环境下的端点检测准确率可以达到94.5%以上. 相似文献

8.

一种基于灰关联分析法的语音激活检测算法

下载免费PDF全文

陈功张雄伟李耀波朱流泉《解放军理工大学学报(自然科学版)》2007,8(1):10-14

为在有色非高斯噪声背景下实时、有效地区分语音信号与各种背景噪声,提出了一种基于灰关联分析的语音激活检测(VAD)算法.该算法提取语音信号过零率、线性预测系数、倒谱系数和转移倒谱系数4种特征参数作为关联参数,通过跟踪语音与噪声灰关联度的变化确定判决门限,实现语音激活检测.仿真结果表明:该算法在无噪声背景中识别率为100%,在-5 dB噪声背景环境,识别率可达80%以上.此算法对有色非高斯背景噪声不敏感,而且计算简单、可靠性高,在语音激活检测中具有可行性. 相似文献

9.

基于子带能量线性映射的噪声中端点检测算法 总被引：8，自引：0，他引：8

田野王作英陆大《清华大学学报(自然科学版)》2002,42(7):953-956

研究噪声环境下的语音端点检测问题。在低信噪比下 ,虽然噪声和语音的频谱分布不同 ,但是传统语音检测算法使用的时域能量没有描述能量在各频域子带的分布 ,对于语音和噪声没有很好的区分性。以前提出的基于时间 -频率的能量参数利用频域的限带能量加上时域能量来进行噪声中的语音检测。但是它们选择频带的依据是语音信号的高能量子带 ,而没有考虑噪声的子带能量分布。该文提出的语音检测方法同时考虑语音和噪声的频域能量分布 ,采用线性映射的方法将 Mel滤波器组的子带能量特征空间映射到噪声和语音最有区分性的一维子空间 ,得到新的特征参数 EL MBE进行语音检测。实验结果表明 ,在噪声环境下基于线性映射的能量参数比时域能量 ,基于时间 -频率的能量有更好语音检测性能。相似文献

10.

基于小波变换的语音激活检测 总被引：4，自引：0，他引：4

黄炳刚周志杰郑翔《解放军理工大学学报(自然科学版)》2006,7(3):210-213

为了提高语音激活检测在多种噪声环境下的检测性能,基于语音与噪声相区别的主要特征,提出了一种基于小波变换的语音激活检测算法.算法将信号频带划分为多个子带,提出用归一化谱分布向量表征信号的谱分布特性,利用小波检测信号分形特征的能力,提出用信号的自相关指数来表征信号的自相关性,结合归一化谱分布向量的线性加权和自相关指数两个因素得出新的激活检测判决准则.实验仿真结果与ITU标准G.729和ETSI标准AMR2中的检测性能进行了分析比较.结果表明,该算法在多种噪声环境下都具有较高的准确率和稳定性. 相似文献

11.

基于自适应分段的语音端点融合检测

下载免费PDF全文

沈希忠郑晓修《上海应用技术学院学报：自然科学版》2018,18(3):273-277

语音端点检测是语音识别预处理的一个重要环节,语音端点判断正确与否直接影响到语音识别的效果。短时能量法与过零率方法是语音端点检测的两类主要方法,融合这两类算法,并结合短时频谱峰值,归纳总结了4条语音端点检测的融合检测准则。在语音分段时提出自适应逐级分段计算,寻找满足误差要求的语音起始和终止端点。语音实验验证了本文所提语音自适应分段融合检测方法的有效性,同时,该方法没有增加语音端点检测的额外计算量。相似文献

12.

适用于短波信号侦察的话音端点检测方法

下载免费PDF全文

张洪德韩鑫怡《解放军理工大学学报(自然科学版)》2023,(1):63-70

针对传统话音端点检测方法在短波低信噪比信道下检测准确率低的问题，提出一种将深度生成对抗网络和自适应参数的子带对数能熵积相结合的话音端点检测方法。该方法首先利用深度生成对抗网络话音增强方法降低噪声对待检测信号的影响，再以自适应参数的子带对数能熵积这一新的话音特征参数为阈值，使用自适应阈值双门限检测法完成话音端点检测。仿真实验结果表明，该方法对于-5 dB信噪比的标准话音库检测的平均加权错误测度仅为13.5%，而对于实际短波侦察信号库检测的平均加权错误测度为16.7%，均优于能零熵法和多窗谱估计谱减与能熵积法。相似文献

13.

语音信号的谱熵检测在车辆通信中的应用 总被引：2，自引：0，他引：2

姚屏申群太王俊年《中南大学学报(自然科学版)》2005,36(5):858-862

结合车辆通信中语音信号的特殊性, 利用傅里叶变换和最大离散熵定理, 对含强噪语音的短时频谱进行分析, 构造出一种熵函数来对语音信号进行语音/噪声的判决. 以一段语音信号为例进行仿真, 研究结果表明, 谱熵检测方法计算简单, 谱熵值和隔离度较大, 具有稳健的抗噪特性, 可以应用于车辆通信中语音信号的检测. 相似文献

14.

一种新的语音端点检测方法及在智能轮椅人机交互中的应用 总被引：2，自引：1，他引：1

罗元黄璜张毅胡章芳《重庆邮电大学学报(自然科学版)》2011,23(4):487-491

针对语音端点检测在一般噪音环境下易受影响,且能降低智能轮椅的语音识别率,提出了短时能量与倒谱距离相结合的语音端点检测方法.实验表明,该方法能提高整个语音识别系统的鲁棒性,通过语音识别控制轮椅的5个基本动作(前进、后退、左转、右转、停止)实现了智能轮椅运动的语音控制. 相似文献

15.

一种基于声学分类的语音激活检测算法

魏涛顾涵铮《合肥工业大学学报(自然科学版)》2001,24(2):222-225

文章涉及了语音编码中最新的一种编码方式——变速率语音编码。语音激活检测 (VAD)算法是其中的关键部分 ,直接影响语音质量和试听效果。文章通过分析国际电信联盟的 G.72 9B标准 ,提出了一种适用于三速率语音编码方式的VA D算法。该算法结合了声学分类 ,对噪声、清音和浊音加以区分 ,最后给出了仿真结果 ,证明其稳健性和有效性相似文献

16.

中文微博观点句识别及评价对象抽取方法

胡默之姚天昉《山东大学学报(理学版)》2016,51(7):81-89

根据微博文本中句子的依存关系和情感词在依存关系中的位置来提取特征,将特征应用于最大熵模型来预测句子的情感倾向(褒义、贬义或中性)。并在此基础上,将词、词性和词在句法结构中的成分作为特征,训练条件随机场统计模型以此预测评价对象。实验结果表明,将句法依存关系作为特征应用到中文微博观点句识别中能够取得不错的效果,明显提高了中文微博观点句的识别率。相似文献