首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
曹清华  王亮 《科技资讯》2011,(9):243-244
基音周期是语音信号重要的参数之一,是进行语音信号数字处理的基础。针对传统自相关提取方法的不足。本文提出了一种小波变换和自相关结合的基音周期检测算法,它克服了小波变换法对某些信号检测时的缺点,在真实语音的基音周期检测中取得了较为满意的效果。  相似文献   

2.
为了提高含噪语音信号在低信噪比情况下的基音检测准确度,以带噪语音信号为研究对象,采用小波变换对带噪语音信号进行减噪处理以提高带噪语音信号的信噪比,再利用自相关函数对减噪后的语音信号进行基音检测。利用Matlab软件对具有不同信噪比的带噪语音信号进行了基音检测改进算法仿真实验。实验结果表明,当带噪语音信号信噪比下降到0d B时,改进算法基音检测正确率略高于未进行小波减噪的基音检测算法正确率。当带噪语音信号信噪比下降到-5d B时,改进算法基音检测正确率明显高于未进行小波减噪的基音检测正确率。  相似文献   

3.
从语音信号的多种常用分析方法着手,讨论了语音信号的特性,用C~(++)语言编程,实现了采用微机对语音信号进行分析,并可在屏幕上同时显示语音的时域波形、预测误差信号、自相关函数、LPC谱和FFT谱等,还提供了对语音进行编辑(包括增删、重叠、放大、缩小等)功能。  相似文献   

4.
提出了一种在自相关域对语音信号进行线性预测分析的方法。证明了只要时域信号是一个全极模型信号,则其相应的自相关序列也是一个全极模型序列,且其全极模型是稳定的,具有更好的抗干扰性能。还提出了一种有效地降低这种模型阶数的算法。将这种模型的功率谱作为语音的特征参数,进行中文讲话者识别实验,取得了满意的结果。  相似文献   

5.
线性预测编码(Linear Predictive Coding)是实现语音编码的一项重要技术.通过对语音信号和LPC的研究,介绍了语音信号的线性预测分析原理,详细分析用来求解线性预测方程的自相关法和计算方法,并用Matlab对实际语音信号进行线性预测编码实验.实验结果表明,应用LPC法合成的语音信号误差小、计算简单、合成速度快.  相似文献   

6.
在对大量的汉语普通话的语音波形进行分析之后发现汉语普通话的基音提取不能用简单的中心削波自相关方法,在进行基音标记时会存在一种基音标记偏移的现象,为此在自相关理论的基础上,根据声调语言的语音信号音高变化特征,对声调语音的基音标记的偏移现象提出了一种基于自相关法和峰值校正的算法,经实践检验,这种算法对声调语言的基音标记的偏移现象能够得到很好的校正。  相似文献   

7.
在对语音信号5种特征参数:短时能量、平均过零率、相对能频比、相对能频积、短时自相关函数语音分段效果详细对比的基础上,提出了利用多参数结合进行语音边界检测与音节分割.同时较之当前主流一帧20 ms的处理方式,提出以2.5 ms为一帧处理,确保在20 ms内检测到信号边界,缩小了搜索时间,提高了实时性.  相似文献   

8.
基于小波变换的语音激活检测   总被引:4,自引:0,他引:4  
为了提高语音激活检测在多种噪声环境下的检测性能,基于语音与噪声相区别的主要特征,提出了一种基于小波变换的语音激活检测算法.算法将信号频带划分为多个子带,提出用归一化谱分布向量表征信号的谱分布特性,利用小波检测信号分形特征的能力,提出用信号的自相关指数来表征信号的自相关性,结合归一化谱分布向量的线性加权和自相关指数两个因素得出新的激活检测判决准则.实验仿真结果与ITU标准G.729和ETSI标准AMR2中的检测性能进行了分析比较.结果表明,该算法在多种噪声环境下都具有较高的准确率和稳定性.  相似文献   

9.
提出了一种精确篡改定位的数字语音取证算法.语音信号分帧后,对各帧信号进行置乱.水印由帧号和信号系数自相关生成,并嵌入到置乱后的信号中.实验分析结果表明,本文算法具有较好的不可听性和对恶意攻击进行精确篡改定位的能力,同时,提高了水印系统的安全性.  相似文献   

10.
根据传统语音信号的分析方法分析了直升机声信号,采用MATLAB软件进行了仿真,提取出了两种直升机声信号的短时自相关函数、短时频谱图和线性预测系数LPC,并分析对比了两种不同型号直升机声信号的特征。实验结果表明短时自相关、短时频谱和LPC等特征参数能较好地分析与识别不同类型的直升机声信号。  相似文献   

11.
为提高噪声不平稳或不可估的情况下语音识别的稳健性,提出了利用自回归模型和短时平稳性假设,估计干净与噪声环境的语音数据,建立相应的语音识别模型,以达到抗噪效果的稳健语音信号处理方法。在N o iseX-92的4种噪声环境(w h ite,babb le,vo lvo,destroyer eng ine)从0到20 dB的不同信噪比下的“863”大词汇连续语音标准数据库的平均识别结果表明,该方法能够使得基于段长分布的隐M arkov模型的语音识别系统在25候选时声学层的音节相对错误率下降达到10.85%以下,同时相对正确识别率上升12.13%。  相似文献   

12.
一种噪声环境下的语音识别方法(线性预测误差法)的研究   总被引:4,自引:0,他引:4  
介绍一种平稳噪声环境下语音识别的新的方法。该方法利用噪声的LPC系数去预测语音信号,从而得到LPC预测序列,然后把它代替原语音序列来进行语音端点的检测、语音特征的提取和在合适的匹配方式下的识别。实验结果表明:该法在噪声环境下自动检测语音端点和提取语音信号的特征是可行的,获得了很满意的识别率。  相似文献   

13.
基于人耳听觉特性提出一种新的抗噪音识别特征:加权组合过零峰值幅度特征,是对过零峰值幅度特征的一种改进。加权组合过零峰值幅度特征以语音数据和差分语音数据作为处理对象,通过计算它们的上升过零率获得频率信息,经幅度非线性压缩获得密度信息,并根据人耳对声音的感知特点对其进行加权,形成最终的输出特征,识别网络使用HMM。仿真实现了使用新特征与原特征的算法识别结果,证明了新特征具有较高的识别率和优良的抗噪性能。  相似文献   

14.
一种新型语音识别系统   总被引:1,自引:0,他引:1  
提出一种新型语音识别系统,采用帧能量与帧过零率的乘积作为指标量进行语音端点检测,以MFCC作为语音信号特征矢量,基于HMM语音识别模型进行语音识别.同时,提出了一种新的抗噪语音识别方法,通过改进型重复Wiener滤波结合PUM模型进行抗噪语音识别,较好地抑制了噪声干扰,提高了语音识别率.  相似文献   

15.
吴兰  杨攀  李斌全  王涵 《广西科学》2023,30(1):52-60
视听语音识别(Audio-Visual Speech Recognition,AVSR)技术利用唇读和语音识别(Audio-Visual Speech Recognition,AVSR)的关联性和互补性可有效提高字符识别准确率。针对唇读的识别率远低于语音识别、语音信号易受噪声破坏、现有的视听语音识别方法在大词汇量环境噪声中的识别率大幅降低等问题,本文提出一种多模态视听语音识别(Multi-modality Audio-Visual Speech Recognition,MAVSR)方法。该方法基于自注意力机制构建双流前端编码模型,引入模态控制器解决环境噪声下音频模态占据主导地位而导致的各模态识别性能不均衡问题,提高识别稳定性与鲁棒性,构建基于一维卷积的多模态特征融合网络,解决音视频数据异构问题,提升音视频模态间的关联性与互补性。与现有主流方法对比,在仅音频、仅视频、音视频融合3种任务下,该方法的识别准确率提升7.58%以上。  相似文献   

16.
藏语语音信号降噪算法研究   总被引:1,自引:0,他引:1  
藏语语音在识别过程中会受到各种信号的干扰,从而影响语音识别的质量。在进行语音识别预处理过程中,语音信号的降噪技术是一个关键的环节。文章通过分析各种降噪手段,重点研究了藏语语音信号降噪方法,提出了符合藏语语音信号降噪的小波包降噪算法。其研究结果为进一步的藏语语音识别技术的研究提供了基础。  相似文献   

17.
调制域谱减法用于鲁棒性语音识别   总被引:2,自引:2,他引:0  
针对语音识别在实际环境中缺乏稳健性的问题,提出了将调制域谱减法应用于语音识别前端的方法。先将语音信号变换到调制域,在调制域用谱减法将信号增强,在减少语音畸变的基础上提高信噪比,然后再进行识别。仿真实验表明,调制域谱减法能在较大的信噪比区间内提高系统识别率,证明此方法能显著提高语音识别系统的抗噪声能力。  相似文献   

18.
一种基于自适应模糊滤波的语音增强方法   总被引:1,自引:0,他引:1       下载免费PDF全文
在语音识别和语者识别中,通常需要先将输入的语音信号进行去噪处理,这样可使识别的正确率大大提高,通常采用基于LMS算法和RLS算法的自适应线性滤波器来进行去噪。提出了一种基于自适应模糊滤波器的语音增强方法,该模糊滤波器是一种非线性滤波器,它在语音信号的特征域空间采用参数映射的方式来滤除噪声,并能够进行自适应结构调整和参数更新。实验结果表明,采用自适应模糊滤波器来滤除噪声比线性滤波器具有更好的效果。  相似文献   

19.
一种基于小波系数方差的语音端点检测方法   总被引:4,自引:1,他引:4  
首先分析讨论了小波变换的原理,在此基础上提出了一种利用小波系数方差识别含噪语音信号中静音与语音的新算法。算法首先对含噪语音进行小波分解,观察各层小波系数的统计特性,提取它们的方差作为检测特征,从而进行语音端点检测。对该算法进行了仿真实验,并与传统的基于能量与过零率的端点检测算法进行了比较。实验结果表明:该算法在低信噪比条件下也能够有效分割语音。  相似文献   

20.
噪声鲁棒性问题是当前语音识别的一个重点,作者提出了一个在已有数据库下通过人为地将噪声和语音信号混合的方法,实现实际环境下的连续英文数字语音识别系统.即通过自设计的程序将采集到的噪声文本根据不同的信噪比随机地添加到现有的语音数据库的语音文本中,使新的数据库中的语音文本符合实际的语音环境.实验结果表明,本系统对带噪声环境下的英文数字的识别率效果好,单词的总体正确识别率达到95.86%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号