期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李明《科技资讯》2011,(10):26-27

提出了一种时频结合的带噪语音端点检测方法。选取时域短时能量和频域熵构成一个新的特征,采用自适应门限进行端点检测。实验结果表明该方法在低信噪比环境下较传统方法提高了端点检测的准确率,鲁棒性较好。相似文献

2.

裴春宝《西藏大学学报》2014,(2):54-58

藏语语音识别技术研究已成为当今一大热点,而端点检测则是语音识别预处理阶段的关键环节之一。文章以标准拉萨藏语为对象,通过将加窗、短时能量和过零率相结合的方法对藏语语音识别技术中端点检测的算法进行了研究。实验表明,采用上述三种算法相结合的研究方法对浊音较重的藏语语音识别较为合适,可显著提高识别率。相似文献

3.

一种改进的基于短时平均幅度的语音端点检测算法研究

柳春《西北民族学院学报》2009,30(1):56-59

在噪声环境下,利用短时平均幅度为特征进行语音端点检测.文章在传统端点检测算法的基础上,研究了汉语音节的特点,提出采用短时平均幅度代替短时能量,并为平均幅度引入判决门限.门限值是根据语音信号背景噪声自动计算得到,从而保证了算法在噪声环境下检测的准确性.实验结果表明,与传统的基于短时能量的端点检测算法相比,改进的算法在高信噪比和低信噪比环境下都具有良好的性能. 相似文献

4.

基于DSP实现语音端点检测 总被引：1，自引：0，他引：1

果永振何遵文刘畅毕志明《华北科技学院学报》2003,5(1):46-49

介绍了一种以DSP芯片为核心的语音端点检测模块，用于有线／无线自动转接设备。该模块的语音端点检测算法应用短时能量、短时过零率和短时自相关语音特征参量进行联合检测，达到了比较满意的端点检测效果。该模块应用于系统中能够实现通话方语音对通话过程的自动控制。相似文献

5.

基于梅尔频率倒谱系数与短时能量的低信噪比语音端点检测

柏顺颜夕宏张生平陈建飞张胜《南京师大学报(自然科学版)》2021,44(2):117-120

低信噪比环境下语音信号的端点检测在语音识别与通信等领域具有重要意义,目前低信噪比环境下的端点检测还存在效率低、识别率不高等问题.本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相加(MFCCa),再与短时能量相除(梅尔能量比)作为语音特征参数的语音端点检测测度,最后利... 相似文献

6.

语音信号处理中双门限端点检测算法的改进

黄洋赵风海卢景《南开大学学报(自然科学版)》2021,54(2):58-62

语音信号识别系统预处理阶段中一个关键步骤是语音信号的端点检测,其精准性直接决定了整个语音识别系统的识别效果. 传统的短时能量和短时过零率双门限检测法中后端点检测存在偏差,且在有噪声的情况下鲁棒性较差. 从动态阈值、短时平均过零率、端点修复、动态检测等方面入手,改进了双门限检测法. 优化了的端点检测算法,使得语音识别系统能够更精确地识别和提取语音,减少了语音识别时间,提高了识别率. 进一步将无用信号和语音信号完全分离开来,有利于后续语音识别的研究. 相似文献

7.

语音端点检测中判决机制的研究 总被引：1，自引：0，他引：1

白顺先马瑞士《大连民族学院学报》2010,12(3):251-253,260

以短时能量和平均过零率为端点检测的参量,分别讨论了基于单门限判决、双门限-两级判决和双门限-三态转换判决机制进行端点检测的方法。实验结果表明,后两种判决机制都能比较准确地检测出语音端点。相似文献

8.

噪声环境下多特征融合的语音端点检测方法

《云南大学学报(自然科学版)》2021,(4)

针对传统语音端点检测方法在噪声环境下鲁棒性较差以及对语音段检测效果不佳的问题,提出一种多特征融合的语音端点检测方法.首先,提取带噪语音信号的子带谱熵特征和基于Mel频率倒谱系数(Mel Frequency Cepstral Coefficient, MFCC)的投影特征,并将Gammatone频率倒谱系数的第一维系数GFCC0特征应用到语音端点检测任务中;然后,对3类特征进行自适应加权融合,得到适用于端点检测的融合特征;最后,采用模糊C均值聚类自适应估计门限阈值,再通过双门限法得到端点检测的结果.所提方法和已有传统方法相比,在7种噪声环境下均取得了更好的端点检测结果,提升了语音端点检测的准确率,特别是在volvo噪声环境下的端点检测准确率可以达到94.5%以上. 相似文献

9.

K-Medoids和FCM融合聚类法语音信号分类的应用

《济南大学学报(自然科学版)》2016,(1)

提出针对广播和航空语音信号的f-kmd融合聚类方法,对2种信号语音数据进行分段,提取每段短时语音数据的均值、方差、平均过零率、平均短时能量、归一化峰度和振幅指标等语音信号的基本特征进行归一化处理,利用模糊c均值聚类(FCM)方法对特征数据进行聚类分析,获得短时分段后的语音信号聚类结果,再对分段后的聚类结果整体上进行K-Medoids聚类分析,得到两类信号的聚类中心。实验表明,融合聚类方法能较好地对广播和航空语音信号进行分类,分类准确率较高,结果较稳定。相似文献

10.

基于时间序列短时分形维数的噪声语音信号端点检测和滤波 总被引：4，自引：0，他引：4

沈亚强冯根良《浙江师范大学学报(自然科学版)》1999,22(1):16-21

本文应用时间序列领事的短时分莆维维数的非线性理论,对低信噪比的语音信号端点检测呼自适应滤波进行了研究,针对信噪比在０ｄＢ和－５ｄＢ的噪声语音信号的端点检测和波进行了计算机仿真实验。实验结果表明,短时分形维维数能较准确地进行语音端点的检测,并且,基于短时分形维维数的自适应滤波器也具有明显的滤波效果。相似文献

11.

一种新的语音端点检测方法及在智能轮椅人机交互中的应用 总被引：2，自引：1，他引：1

罗元黄璜张毅胡章芳《重庆邮电大学学报(自然科学版)》2011,23(4):487-491

针对语音端点检测在一般噪音环境下易受影响,且能降低智能轮椅的语音识别率,提出了短时能量与倒谱距离相结合的语音端点检测方法.实验表明,该方法能提高整个语音识别系统的鲁棒性,通过语音识别控制轮椅的5个基本动作(前进、后退、左转、右转、停止)实现了智能轮椅运动的语音控制. 相似文献

12.

应用倒谱特征的带噪语音端点检测方法 总被引：7，自引：0，他引：7

韦晓东胡光锐任晓林《上海交通大学学报》2000,34(2):185-188

传统的语音端点检测方法以信号的短时能量、过零率等简单特征为判决特征参数。这些方法在实际应用中,尤其当信号噪比比较低时,无法满足系统的需要。文中利用语音信号的倒谱特征作为判决抽样信号帧是否为语音信号的依据,并提出了倒谱距离测量法和循环神经网络法,通过对宽带噪声－白噪声干扰情况和一种特殊噪声－汽车噪声情况的实验,发现倒谱特征参数的语音信号端点检测方法在噪声环境下具有传统的能量方法无法比拟的优越性,更适相似文献

13.

一种改进的基于子带谱熵的语音激活检测方法

宋喆张德民张天骐《重庆邮电学院学报(自然科学版)》2009,(6)

语音信号的激活检测(voice activity detection,VAD)是变速率语音编码的关键技术,用来检测通信时是否有语音片存在。在有噪环境下对语音信号的激活检测是非常重要而困难的。对传统子带谱熵算法进行了改进,提出了一种能够用于语音激活检测的新算法。该算法利用语音谱熵和噪声谱熵分布的不同,将信号的数字特征(方差、均值等)与传统子带谱熵相结合,用于区分语音段和非语音段。计算机仿真结果表明,在高斯白噪声环境下,改进后的子带谱熵算法能很好地区分说话人的语音段和非语音段,在某种程度上解决了传统语音激活检测算法结构复杂、参数难调、易受噪声影响等问题。相似文献

14.

基于有限状态机的汉语数字语音端点检测 总被引：3，自引：0，他引：3

黄秋安姜波汪秉文《湖北大学学报(自然科学版)》2004,26(1):35-38

研究了数字语音短时能量和过零率特点,提出了基于有限状态机的端点检测新算法．该算法经实验测试,不仅检测的正确率高,而且系统的响应速度快,符合语音识别的实时性要求．相似文献

15.

基于维特比算法的深度神经网络语音端点检测

李文洁张晴晴张鹏远颜永红摆亮《重庆邮电大学学报(自然科学版)》2018,30(2):210-215

语音端点检测(voice activity detection,VAD)是在连续语音信号中,将语音和非语言片段分离的技术。VAD在语音识别、说话人识别、语音编码等领域起着重要作用。传统VAD算法在类型已知的噪声环境下可以达到较好的性能,但在实际情况中,未知噪声的影响通常会使系统性能下降显著,在差异化噪声下的VAD是端点检测的研究难点。在总结现有语音端点检测算法基础上,提出了一种基于深度神经网络的语音端点检测方法,同时结合维特比算法,与基于贝叶斯信息准则(bayesian information criterion, BIC)的混合高斯模型(gaussian mixture model,GMM) 语音端点检测系统进行对比,在大词汇连续语音识别系统中的实验结果表明,将深度神经网络结合维特比算法,应用于语音端点检测,在复杂噪声环境下取得了更好的效果,适应性更强。相似文献

16.

低信噪比下基于谱熵的语音端点检测算法 总被引：14，自引：0，他引：14

李晔张仁智崔慧娟唐昆《清华大学学报(自然科学版)》2005,45(10):1397-1400

为提高语音端点检测系统在低信噪(0 dB以下)下检测的准确率,提出了一种基于谱熵的端点检测算法。将每帧信号分为16个子带,选取频谱分布在250~3.5 kH z并且能量不超过该帧总能量90%的子带,计算经过语音增强后的子带能量以及各子带信噪比,根据各子带信噪比的不同调整其在整个谱熵计算过程中的权重,然后平滑谱熵,以最终的谱熵作为端点检测的依据。实验结果表明,此方法在较低的信噪比下能够显著地提高端点检测的准确率。对坦克噪声,检测效果明显优于G.729中的端点检测算法,即使在-5 dB的信噪比下,仍然可以达到95%以上的检测率。相似文献

17.

用于周期分解语音活动检测的基频提取方法研究 总被引：1，自引：0，他引：1

刘海波李辉凌震华《中国科学技术大学学报》2012,(2):106-111

介绍了基于语音信号周期分解的语音活动检测算法.传统语音活动检测算法在动态低信噪比背景噪声环境下的效果很不理想,这主要是因为传统方法中提取的能量与过零率等检测特征针对的是平稳噪声,对信噪比的变化很敏感.而本文介绍的周期分解语音活动检测方法能较好地解决这个问题,因为语音信号中浊音段的周期性是区别一般噪声信号的重要特征,并且该特征受背景噪声类型和信噪比变化的影响小.在周期分解语音活动检测方法中,基频提取的准确性对最终检测性能有很大影响.针对此情况,提出了自相关、循环均值幅度差分和YIN三种基频提取算法相融合的方法.实验结果表明,在背景噪声为白噪声、汽车噪声、嘈杂人声以及信噪比0dB,5dB,10dB的情况下,该方法相对单一基频提取算法,可以有效提升基频提取与周期分解语音活动检测的准确性. 相似文献

18.

说话人识别中改进的MFCC参数提取方法 总被引：1，自引：0，他引：1

何朝霞《科学技术与工程》2011,18(18):4215-4218,4227

在说话人识别技术中,特征参数的提取对语音训练和识别有着非常重要的作用。而Mel频标倒谱系数MFCC是一种常用的特征,它能对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。同时由于语音信号具有时变和混沌特性,以非线性随机共振理论和人类对听觉的理解为基础,提出了一种基于随机共振的MFCC特征参数提取方法。通过实验比较两种方法的结果,论证了改进方法的可行性以及优越性,为说话人识别技术中特征参数提取提供了一条新的研究方向。相似文献

19.

声音转换实验系统的研究与实现

刘金凤符敏程德福《南京理工大学学报(自然科学版)》2005,29(Z1):211-214

声音转换是将源说话人的声音转化成具有目标说话人特征信息的声音的方法。该系统选择共振峰频率和带宽及基音周期等声音特征参数,分别使用LPC求根法和自相关法提取这些特征参数。矢量量化的码本映射方法实现声音特征转换,共振峰参数法合成转换语音。实验中对5个国际音标与语音中的元音进行转换,并使用MFCC听觉倒谱法对转换结果进行评估,其中男声到女声的转换后的语音到目标语音的MFCC距离比源语音到目标语音MFCC距离平均减小48.8%。相似文献

20.

加密语音在GSM话音业务信道传输的一种实现方法

杨于村冯穗力季新生叶梧《重庆邮电学院学报(自然科学版)》2009,(5)

移动通信系统的安全现状引发了移动语音安全课题的研究,语音加密是实现端到端语音安全通信的有效措施,但是加密后的语音数据不能直接在移动话音信道中传输。给出了加密语音在GSM话音业务信道中传输的一种实现方法,并针对GSM全速率RPE-LTP声码器,采用语音信号线性预测分析与合成技术,设计了类语音调制解调器,能够实现加密语音数据与类语音信号的可靠转换,解决了加密数据接入移动通信网的问题,并克服了GSM系统代码转换机制及话音激活检测(VAD)模块带来的不利影响,为加密语音在移动话音信道的传输提供了可能。相似文献