首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
针对基于短时能量和过零率相结合的语音边界检测法在实际应用中的不足,提出了一种改进方法——基于短时相关性和极值点的语音边界检测法,并在MATLAB环境下进行实验测试,在语音客观评价及语音识别算法中取得了良好的效果.  相似文献   

2.
藏语孤立词语音识别系统研究   总被引:3,自引:0,他引:3  
藏语语音研究相当滞后,文章结合语音识别知识和藏语特点,尝试性地研究了藏语孤立词语音识别研究.首先提取MFCC参数作为语音特征参数,形成语音模板库,采用DTW模型实现了语音识别系统,并且针对藏语孤立词多音节的特点,改进了传统的基于短时能量和短时过零率双门限检测法,即加入了音节间静音段时长门限,提高了孤立词语音信号检测的准确性和识别率.  相似文献   

3.
语音信号识别系统预处理阶段中一个关键步骤是语音信号的端点检测,其精准性直接决定了整个语音识别系统的识别效果. 传统的短时能量和短时过零率双门限检测法中后端点检测存在偏差,且在有噪声的情况下鲁棒性较差. 从动态阈值、短时平均过零率、端点修复、动态检测等方面入手,改进了双门限检测法. 优化了的端点检测算法,使得语音识别系统能够更精确地识别和提取语音,减少了语音识别时间,提高了识别率. 进一步将无用信号和语音信号完全分离开来,有利于后续语音识别的研究.  相似文献   

4.
在对语音信号5种特征参数:短时能量、平均过零率、相对能频比、相对能频积、短时自相关函数语音分段效果详细对比的基础上,提出了利用多参数结合进行语音边界检测与音节分割.同时较之当前主流一帧20 ms的处理方式,提出以2.5 ms为一帧处理,确保在20 ms内检测到信号边界,缩小了搜索时间,提高了实时性.  相似文献   

5.
蔡柳  赵晨星 《甘肃科技》2008,24(5):46-48
随着对安多藏语语音识别技术的研究,端点检测发挥着重要的作用,准确的判断语音端点对识别性能有很大的影响。引用了双门限检测法对藏语语音进行端点检测实验,在实验中对短时平均过零率进行修正,克服了随机噪音的影响,取得了较好的效果。  相似文献   

6.
一种基于听觉掩蔽效应的语音增强方法   总被引:5,自引:1,他引:5  
为提高增强语音的听觉效果 ,研究了一种基于听觉掩蔽效应的语音增强方法。推出了一个功率谱域的基于听觉掩蔽效应的不等式准则 ,并用这个准则动态地选择一个作为语音短时谱幅度估计器的非线性函数的参数值 ,通过这个参数自适应变化的非线性函数对语音谱幅度进行估计实现语音增强。在此基础上 ,设计实现了一个单声道语音增强算法。对增强语音的客观测试和非正式听音测试表明 :相对于传统的减谱法和对数短时谱幅度最小均方误差估计增强法 ,基于听觉掩蔽效应的语音增强方法能更好地抑制背景噪声  相似文献   

7.
为提高卷积环境下语音识别系统的鲁棒性,提出了一种基于时/频ICA(independent component analysis)的卷积噪声模型估计方法.所提算法首先使用ICA方法从含噪语音信号中提取纯净语音信号的短时功率谱,然后在MEL滤波器组域内将含噪语音的短时谱减去纯净语音的短时谱,并根据去噪后卷积噪声的短时谱估算其HMM(hidden markov model)模型.在仿真和真实环境下进行了语音识别实验,其识别正确率相比较传统的卷积噪声估计方法分别提升了4.70%和4.75%.实验结果表明,论文所提算法能够实现对卷积噪声的精确估计,并有效提升卷积噪声环境下语音识别系统的性能.  相似文献   

8.
提出短时能频值(EFV)的新概念,设计了用短时能频值的参量来估计语音起止点的新的有效算法,提高了语音信号与背景噪声的分辨力。运用基于短时能频值EFV估计语音起止点的算法,研究汉语普通话音素的区别特征,上机计算分析证明了EFV门限能够很好地从噪声中分辨出语音信号,有着较好的稳定性和较高的语音-噪声分辨力。  相似文献   

9.
端点检测是语音信号处理过程中非常重要的一步,它的准确性直接影响到语音信号处理的速度和结果。研究了短时能量、短时幅度差、短时过零率和短时过门限率的语音端点检测算法,并对短时过零率、短时过门限率在有无噪情况下的检测效果做了分析和比较。  相似文献   

10.
在噪声环境下,利用短时平均幅度为特征进行语音端点检测.文章在传统端点检测算法的基础上,研究了汉语音节的特点,提出采用短时平均幅度代替短时能量,并为平均幅度引入判决门限.门限值是根据语音信号背景噪声自动计算得到,从而保证了算法在噪声环境下检测的准确性.实验结果表明,与传统的基于短时能量的端点检测算法相比,改进的算法在高信噪比和低信噪比环境下都具有良好的性能.  相似文献   

11.
为了解决语音分离中非负矩阵分解(non-negative matrix factorization,NMF)、深度神经网络(deep neural network,DNN)等算法没有考虑语音时序相关性的问题。结合NMF和长短时记忆网络(long short-term memory,LSTM)算法提出NMFLSTM单通道语音分离算法:将语音信号的幅度谱作为模型的输入特征,通过训练NMF和LSTM模型获得目标语音的基矩阵和系数矩阵,并对其结果进行语音重构最终实现语音分离。实验结果表明:相比于未考虑语音时间连续性的算法,使用NMFLSTM算法分离语音的客观语音质量评估值(perceptual evaluation of speech quality,PESQ)有明显提升,其最大值超过3. 1,获得良好的分离效果。  相似文献   

12.
针对传统谱估计增强算法易产生语音畸变、导致语音清晰度低的问题,提出了一种失真控制下的短时谱估计语音增强的新算法.该算法首先引入语音畸变的客观度量参数,并根据这一参数得到抑制语音畸变的约束条件,然后结合人耳听觉掩蔽特性和无语音概率参数,修正最小均方误差对数谱估计函数,最后联立约束条件和估计函数,得到增强后的语音,从而实现了在噪声抑制和语音畸变之间的折中,改善了语音增强的效果.主观试听和客观测试结果均表明,与其他谱减法相比,在相同的信噪比和去噪度条件下,新算法的语音畸变度最小且几乎察觉不到音乐噪声.  相似文献   

13.
研究了陆地集群无线通信(TETRA)数字集群移动通信系统的语音压缩编解码算法的基本原理。TETRA语音压缩编解码器使用一种低复杂度的ACELP(代数码激励线性预测)算法,通过线性预测和磁量量化等方法降低比特率,并通过自适应码本和代数码本相结合的方法降低了CELP声码器的复杂度,兼顾了较好的语音质量和较低的比特率。在微机上通过C评议和Matlab对TETRA的语音编解码算法进行了实时仿真,语音信号由微机声卡录入和播放。仿真结果表明,该算法具有速率低,重建语音可懂度高,计算复杂度低等优点,适于在移动通信中应用。  相似文献   

14.
小波分析在信号处理方面具有优越性.本文将其应用于语音信号处理,所做的主要工作:证明了Daubechies小波语音能量守恒;基于含噪语音的统计特征,提出了样本方差阈值小波分解算法及重构算法;将新的阈值算法和Waveshrink算法用于语音除噪,并运用于多组实验进行对比.仿真数据表明,本算法效果较优.  相似文献   

15.
8kbit/s短延时语音编码算法LD-ACELP,采用了代数码本激励线性预测(ACELP)的编码方法,利用语音的帧间相关性对线谱对参数采用了分裂式矢量量化技术,并采用高效的码本结构、码本搜索技术和增益矢量量化技术来获得较高的语音合成质量和较短的算法延时。LD-ACELP的帧长为10ms,算法延时为15ms。通过信噪比及人耳主观听觉实验等性能测试表明,该算法具有与国际电联16kb/s短延时语音编码算法LD-CELP(G.728)相当的语音合成质量。  相似文献   

16.
考虑到传统单通道语音增强算法对噪声抑制的局限性,本文采用由两个微型麦克风阵列组成的双微阵列,利用该阵列空间结构的时空域特性对含噪语音进行处理,提出了一种适用于双微阵列的语音增强算法。该增强算法是将各通道采集到的带噪语音信号先使用对数最小均方误差(Logarithmic Minimunm Mean Square Error,LogMMSE)提升其信噪比,然后利用频域宽带最小方差无畸变响应(MVDR)通过对目标声源信号的获取,保留目标声源方向的信号并抑制其他方向的信号干扰,最后通过一个改进可懂度结合改进最小控制递归平均(Improved Minimum Controlled Recursive Average Algorithm,IMCRA)噪声估计的维纳滤波器来去除噪声残留提升语音质量。仿真实验结果表明,相比传统的单通道语音增强算法,该算法具有良好的噪声抑制性能。  相似文献   

17.
基于编码速率600bps的SELP语音算法,提出一种新的语音编解码芯片,电路设计时满足算法复杂度高、运算量大的需求,从而使声码器在极低的速率下更高效地工作,获得更好的语音重建质量.同时,声码器在设计时采用了可重构的思想,对于其他定点语音算法,只需要将算法程序注入到程序存储区就能实现多种算法在同一款芯片的重构。  相似文献   

18.
为解决使用语音信号准确识别动物以保护和研究野生动物的问题,提出一种全连接算法与稀疏连接算法相结合的全卷积神经网络(FCNN: Fully Convolutional Neural Network),用于语音的自动识别.利用全连接算法提取更多的组合特征,稀疏连接算法筛选重要特征可加快收敛速度.同时给出了具体的模型结构及算...  相似文献   

19.
一种改进的DTW语音识别系统   总被引:1,自引:0,他引:1  
苏昊  王民  李宝 《中国西部科技》2011,10(1):38-39,94
动态时间规整(Dynamic Time Warping,DTW)是语音识别的一种简单有效的方法,该算法基于动态规划的思想,解决了发音长短不一的模板匹配问题,是语音识别中出现较早、较为经典的一种算法。这里改进了传统的DTW算法,将其应用到实时语音识别系统中,并在计算机上进行了仿真。实验结果表明,改进后的算法,能有效提高孤立词的识别性能。  相似文献   

20.
针对低信噪比下语音增强困难的问题及经验模态分解(empirical mode decomposition,EMD)在语音增强中的有效应用,提出了一种基于EMD的前后置滤波语音增强算法.将含噪语音信号进行卡尔曼滤波后做EMD分解,采用能量阈值法判断出含有残余噪声的本征模态函数(IMF),对其小波变换后与其余IMF重构为最终的语音增强信号.实验表明,在输入信噪比为-10~5dB的不同噪声环境下,以时域分段信噪比及语音质量感知评测PESQ作为评价指标,效果均优于单独的EMD、小波软阈值法及卡尔曼滤波算法,是一种有效的语音增强算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号