首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
低信噪比环境下语音信号的端点检测在语音识别与通信等领域具有重要意义,目前低信噪比环境下的端点检测还存在效率低、识别率不高等问题.本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相加(MFCC_a),再与短时能量相除(梅尔能量比)作为语音特征参数的语音端点检测测度,最后利用模糊C均值聚类算法自适应确定双门限阈值进行端点检测.选取TIMIT语音库中的50条语音信号进行实验,结果表明:在信噪比为5 dB、0 dB、-5 dB的噪声环境下,与能零比、谱熵等算法相比,本算法端点识别准确率均有所提高,其中在-5 dB信噪比环境下提升了约30%.  相似文献   

2.
语音端点检测中判决机制的研究   总被引:1,自引:0,他引:1  
以短时能量和平均过零率为端点检测的参量,分别讨论了基于单门限判决、双门限-两级判决和双门限-三态转换判决机制进行端点检测的方法。实验结果表明,后两种判决机制都能比较准确地检测出语音端点。  相似文献   

3.
语音信号识别系统预处理阶段中一个关键步骤是语音信号的端点检测,其精准性直接决定了整个语音识别系统的识别效果. 传统的短时能量和短时过零率双门限检测法中后端点检测存在偏差,且在有噪声的情况下鲁棒性较差. 从动态阈值、短时平均过零率、端点修复、动态检测等方面入手,改进了双门限检测法. 优化了的端点检测算法,使得语音识别系统能够更精确地识别和提取语音,减少了语音识别时间,提高了识别率. 进一步将无用信号和语音信号完全分离开来,有利于后续语音识别的研究.  相似文献   

4.
针对传统语音端点检测方法在噪声环境下鲁棒性较差以及对语音段检测效果不佳的问题,提出一种多特征融合的语音端点检测方法.首先,提取带噪语音信号的子带谱熵特征和基于Mel频率倒谱系数(Mel Frequency Cepstral Coefficient, MFCC)的投影特征,并将Gammatone频率倒谱系数的第一维系数GFCC0特征应用到语音端点检测任务中;然后,对3类特征进行自适应加权融合,得到适用于端点检测的融合特征;最后,采用模糊C均值聚类自适应估计门限阈值,再通过双门限法得到端点检测的结果.所提方法和已有传统方法相比,在7种噪声环境下均取得了更好的端点检测结果,提升了语音端点检测的准确率,特别是在volvo噪声环境下的端点检测准确率可以达到94.5%以上.  相似文献   

5.
应用倒谱特征的带噪语音端点检测方法   总被引:7,自引:0,他引:7  
传统的语音端点检测方法以信号的短时能量、过零率等简单特征为判决特征参数。这些方法在实际应用中,尤其当信号噪比比较低时,无法满足系统的需要。文中利用语音信号的倒谱特征作为判决抽样信号帧是否为语音信号的依据,并提出了倒谱距离测量法和循环神经网络法,通过对宽带噪声-白噪声干扰情况和一种特殊噪声-汽车噪声情况的实验,发现倒谱特征参数的语音信号端点检测方法在噪声环境下具有传统的能量方法无法比拟的优越性,更适  相似文献   

6.
传统的语音端点检测方法以信号的短时能量、过零率等简单特征作为判决特征参数.这些方法在实际应用中,尤其当信号信噪比比较低时,无法满足系统的需要.文中利用语音信号的倒谱特征作为判决抽样信号帧是否为语音信号的依据,并提出了倒谱距离测量法和循环神经网络法.通过对宽带噪声-白噪声干扰情况和一种特殊噪声——汽车噪声情况的实验,发现倒谱特征参数的语音信号端点检测方法在噪声环境下具有传统的能量方法无法比拟的优越性,更适合于实际应用.  相似文献   

7.
针对语音端点检测在一般噪音环境下易受影响,且能降低智能轮椅的语音识别率,提出了短时能量与倒谱距离相结合的语音端点检测方法.实验表明,该方法能提高整个语音识别系统的鲁棒性,通过语音识别控制轮椅的5个基本动作(前进、后退、左转、右转、停止)实现了智能轮椅运动的语音控制.  相似文献   

8.
为提高识别率和识别效率,采用双门限过零率和短时能量作为端点检测的依据,提取Mel频率倒谱系数作为语音特征参数,并使用DTW算法进行模式匹配.由于传统DTW算法计算量大,所以采用局部路径约束和区域约束进行改进,并用Matlab对改进后的DTW算法进行了仿真.实验证明该算法对孤立词语音识别能够达到较好的识别结果.  相似文献   

9.
基于倒谱距离的语音端点检测改进算法   总被引:5,自引:1,他引:5       下载免费PDF全文
在讨论传统倒谱距离语音端点检测算法不足的基础上,提出了一种改进方案,该方法首先估计短时信噪比,然后由统计方法确定短时信噪比与门限的关系,进而完成正确的语音端点判决。通过对3种典型噪声环境下信噪比从-5 dB到20 dB的带噪语音信号进行的仿真实验结果表明,所提方法能更为准确地检测到语音端点。  相似文献   

10.
在噪声环境下,利用短时平均幅度为特征进行语音端点检测.文章在传统端点检测算法的基础上,研究了汉语音节的特点,提出采用短时平均幅度代替短时能量,并为平均幅度引入判决门限.门限值是根据语音信号背景噪声自动计算得到,从而保证了算法在噪声环境下检测的准确性.实验结果表明,与传统的基于短时能量的端点检测算法相比,改进的算法在高信噪比和低信噪比环境下都具有良好的性能.  相似文献   

11.
陈东  黄智鹏 《科学技术与工程》2021,21(11):4486-4491
使用违法鸣笛辅助执法设备监测城市交通中汽车鸣喇叭事件的发生,可以有效地治理扰民的喇叭噪声,汽车鸣喇叭声的识别方法是其关键.为了准确高效地在交通噪声里识别出汽车鸣喇叭声,采用支持向量机(support vector machine,SVM)作为喇叭声和交通噪声的二分类器,针对汽车喇叭声的谐波特征分布特点,提取其梅尔频率倒谱系数(Mel frequency cepstrum coefficient,MFCC)作为特征向量,并分析MFCC的梅尔滤波器个数及特征维数对识别效果的影响.实验结果表明,通过增加MFCC特征中梅尔滤波器个数及特征维数可以改善识别效果,信噪比越低越明显.  相似文献   

12.
高性能汉语数码语音识别算法   总被引:13,自引:0,他引:13  
提出了一个高性能的汉语数码语音识别 (MDSR)系统。 MDSR系统使用 Mel频标倒谱系数 (MFCC)作为主要的语音特征参数 ,同时提取共振峰轨迹和鼻音特征以区分一些易混语音对 ,并提出一个基于语音特征的实时端点检测算法 ,以减少系统资源需求 ,提高抗干扰能力。采用了两级识别框架来提高语音的区分能力 ,其中第一级识别用于确定识别候选结果 ,第二级识别用于区分易混语音对。由于采用了以上改进 ,MDSR系统识别率达到了 98.8% .  相似文献   

13.
车辆音频信号具有复杂的特征,单一特征提取方法不能全面反应该特点。为了使提取的音频信号特征能更好地反映车辆原始信号,本文提出了将已有的短时能量(ENERGY)、短时傅里叶变换(STFT)及梅尔倒谱系数(MFCC)特征提取方法进行融合的方法,依据支持向量机(SVM)的分类识别算法,达到车辆识别的目的。实验表明,提出的组合方法优于单一提取方法,实现了提高识别率的目标,其中,ENERGY+MFCC组合方式效果最好。  相似文献   

14.
本文主要在介绍语音端点检测的基本步骤和Mel倒谱距离、信息熵两种非时域端点检测算法,在此基础上利用Matlab软件实现这两种语音端点检测算法,并根据仿真结果比较分析,总结出Mel倒谱距离和信息熵两种非时域端点检测算法的特性。  相似文献   

15.
针对当前智能车辆检测算法在实际应用中存在误差、测量结果不够准确等问题,使用基于运动车辆中车底阴影线算法的车辆检测机制,并利用车底阴影稳定存在特征解决车辆检测问题,进一步基于机器视觉的双目立体匹配测距方法实现对前方最近车辆距离测量,为智能车辆及驾驶员辅助系统提供信息。笔者采用的车底阴影线方法及双目测距最终实现结果证实,可以获取较为精确的道路前方的车辆及距离信息,有效检测距离为10 ~ 50 m,整体识别率达到85%。  相似文献   

16.
针对汽车自主驾驶技术领域车距侦测问题,利用影像摄取硬件和软件系统,并提出一种基于单目视觉的车距侦测算法,实现了车距的实时侦测.实验证明此方法在白天、黑夜、复杂路况及天气恶劣的情况下均能稳定运行,且此算法有效减少了Hough运算量,具有较强鲁棒性及实时性.  相似文献   

17.
语音端点检测是语音识别中非常重要的部分,识别率高低很大程度上取决于端点检测的精确程度。在高信噪比(signal-noise ratio,SNR)的实验室环境下,端点检测有很好的效果;但比如像工厂和市场等低SNR环境下,传统的检测方法性能迅速降低,端点检测无法达到预期效果。针对低SNR语音的端点检测,先通过谱减法对带噪语音进行降噪,再分别求出每帧语音信号的能量与频带方差的乘积,将乘积值作为参数进行双门限端点检测的思路,提出了一种能量和频带方差结合的端点检测方法。将TIMIT数据集中语音叠加高斯随机噪声、NOISEX 92噪声库中的factory噪声和volvo噪声进行实验。结果表明,当SNR在-10 d B时,仍有较好的检测效果,显著提高了语音端点检测的效果。  相似文献   

18.
姜琦  冯庆胜 《科学技术与工程》2022,22(16):6680-6686
为了准确地识别铁路转辙机所处的工作状态,保证列车能够安全行驶并转向,提出了一种基于声音信号的转辙机状态识别方法。首先将声音信号预处理后提取其梅尔倒谱系数(MFCC);为更加全面表征转辙机声信号的特点,对MFCC进行改进得到多尺度MFCC特征;引入卷积神经网络(CNN)构建转辙机声信号识别模型,并采用五折交叉验证法获得两种特征的识别准确率。本实验将S700K型转辙机在四种状态下运行时采集的真实声音信号进行训练和测试。实验结果表明,多尺度MFCC特征可使转辙机声音状态识别准确率至少提高7.5%。并且在低信噪比下,多尺度MFCC特征也有更好的表现,其准确率相较传统MFCC可提升35%。  相似文献   

19.
针对传统车载交通信息数据发布系统存在操控复杂、用户体验效果差、响应时间过程等问题,提出一种基于驾驶行为识别的车载交通信息数据实时发布系统。在车联网环境下,设计车载交通信息数据实时发布系统的硬件部分,其主要包括ARM处理器、GPS接收模块、行车记录信号采集模块、接口模块、存储器、车载网络、报警模块等。通过层次分析法对主因子决策权重进行分析,对驾驶行为特征进行提取,提取结果即为驾驶行为识别结果,根据识别结果和交通安全调查结果得到影响驾驶员行为的关键组成因子,实现对异常汽车运行信息和异常驾驶行为信息进行警报处理。实验结果表明,所研究系统易于操控,并具有良好的人机交互体验,能够减轻驾驶员心理负担,提高驾驶安全性,且响应时延低。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号