首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 699 毫秒
1.
基于语音编码系统的语音识别,由于受编码的影响其识别效果在编码速率下降时显著降低。传统的识别方法从重构语音波形中提取特征参数,并针对该特征参数进行训练和识别。比较了基于编码语音的识别准确率和基于编码参数的识别准确率,并研究了编码参数对识别准确率的影响。在此基础上,通过选择受编码影响较小的编码参数,直接将LPC参数和残差信号参数组合起来构成特征参数进行语音识别。实验结果表明,采用这种方法的AMR语音识别系统,其识别效果接近于基于原始语音的识别效果。  相似文献   

2.
基于小波变换的说话人语音特征参数提取   总被引:1,自引:3,他引:1  
在说话人识别系统中,提取反映说话人个性的语音特征参数是系统的关键问题之一,本文在研究小波变换理论的基础上,借鉴MFCC参数的提取方法,用小波变换代替傅立叶变换,提取了新的特征参数DWTMFC,并对常用的coif3、db6、db4、sym4、bior2.4这几种小波函数进行了比较,实验结果表明:coif3为提取语音特征参数的最优小波函数,DWTMFC参数的性能优于MFCC参数。  相似文献   

3.
基于Teager能量算子和小波变换的语音识别特征参数   总被引:3,自引:0,他引:3  
基于Teager能量算子在抑制噪声和小波变换时多分辨特性,用Teager能量算子结合二进小波变换得到一种新的语音识别系统中的前端输出特征参数.该参数的一部分来源于Teager能量算子与传统的倒谱分析相结合产生的参数TEOCEP;另一部分基于小波而得到的小波能量矢量参数DWE,最后提出了TEOCEP-DWE特征参数.对新的语音特征参数进行实验分析表明,本算法能提高语音识别的性能.  相似文献   

4.
邱云峰 《科技信息》2010,(26):145-146
目前小波在语音识别的信号处理,语音端点检测、语音分析与合成、语音增强以及语音编码等中都有非常广泛的应用。本文结合小波变换介绍一种语音增强方法,应用matlab中的小波工具箱中的daubechies小波进行实例仿真。  相似文献   

5.
基于Teager能量算子(TEO)的抑制噪声性、小波变换的多分辨特性以及具有频率弯折效应的Laguerre序列,提出一种新的语音识别特征参数提取算法.该参数一部分来源于TEO与传统的倒谱分析,它们相结合产生的参数称之为TEOCEP;另一部分基于频率弯折小波得到的频率弯折小波能量(FWWE)矢量参数,由此提出了TEOCEP-FWWE特征参数.对新的语言特征参数实验评估表明,该算法提高了语音识别的性能,具有较强的鲁棒性.  相似文献   

6.
基于径向基神经网络的数字"0"~"9"语音识别   总被引:1,自引:0,他引:1  
介绍了语音信号分析方法中的线性预测编码技术和滤波器组分析方法,并推导了MFCC系数.分析并讨论了语音识别研究中径向基神经网络的设计原则,以及特征参数等对语音识别结果的影响.实验结果表明:基于径向基神经网络的语音识别方法有着较好的识别性能和应用效果,针对非特定人的孤立词识别,识别率可以达到90%以上.  相似文献   

7.
田丽 《科技咨询导报》2008,(29):178-178
利用小波的多尺度性质,在提取语音信号的识别特征之前,用小波对语音信号的有用信息进行处理,并抑制无关信息对识别所产生的干扰。结果表明:经过小波预处理后提取的特征,提高了语音的识别率。  相似文献   

8.
语音是人类表达情感的重要方式之一,语音中情感信息的识别已然成为人机交互不可或缺的组成部分,目前的语音情感识别技术存在一定的问题,如冗余大、识别率低等,故提出一种改进KNN识别算法。首先提取能够表征音频情感信息的特征参数,并通过优化算法对其进行筛选,然后对优化特征集运用所提算法进行识别验证。实验结果表明,笔者所提的识别算法能够用于基于语音信息的个体情绪识别状态。  相似文献   

9.
自适应高斯混合模型语音增强方法   总被引:1,自引:0,他引:1  
陈立伟  王文姝   《应用科技》2009,36(7):11-15
语音增强是解决噪声污染的有效方法,它的首要目标是在接收端尽可能从带噪语音中恢复纯净的语音信号.针对噪声环境下的语音增强问题,提出了一种语音增强新方法.该方法利用小波子带的方向性特点以及小波系数尺度内的相关性,将小波系数的概率分布建模为一种自适应高斯混合模型,在贝叶斯框架中采用这种概率模型可以得到一种具有空间自适应性的贝叶斯萎缩函数.利用这种萎缩函数可以实现对小波系数的修正.仿真实验表明,该算法对于噪声有较好的抑制作用,该算法在主观和客观测试中都具有良好的语音增强效果,可以在语音识别、语音编码中获得应用.  相似文献   

10.
语音识别是根据语音波形中反映说话人生理、心理和行为的语音特征参数识别说话人身份。由于其独特的技术优势,语音识别技术在公共安全领域得到越来越广泛应用,为公安部门有效预防犯罪和快速侦查破案、提高工作水平和工作效率提供支持和帮助。随着技术的发展,语音识别必将成为科技强警的重要手段之一。  相似文献   

11.
基于代数码激励线性预测(ACELP)算法,介绍了一种编码速率为4.75kb/s的语音编码算法。算法采用高效的码本结构和码本搜索技术。核算法运算量小,延时小。首先对算法进行了概述,然后分别对算法所采用的开环基音周期分析、自适应码本搜索、代数码本结构以及代数码本搜索方式进行了介绍,重点对算法的代数码本结构和所采用的代数码本搜索方式进行了详细分析。定点C语言模拟结果表明,该算法在4.75kb/s速率上可以合成很高音质的话音。  相似文献   

12.
一种基于ACELP的4.8kb/s高质量语音编码算法   总被引:1,自引:1,他引:0       下载免费PDF全文
介绍了一种基于代数码激励线性预测(ACELP)的4.8kb/s语音编码算法。首先对算法进行了概述,然后分别对算法所采用的基音周期估计,基音预测,代数码本结构以及代数码本搜索方式进行了介绍。重点对算法所采用的代数码本搜索技术进行了详细分析。定点C语言模拟结果表明,该算法在4.8kb/s速率上可以合成很高音质的话音。  相似文献   

13.
从子波变换这个新的概念,给出了一种语音信号预测模型残差激励信号的分解方法,提出了一种语音信号编码方案,即子波激励的线性预测编码法(WELP),给出了部分实验结果,实验表明,在相同的音质条件下,WELP方法比其它方法能更进一步降低比特率,有希望在低比特率语音编码中得到应用。  相似文献   

14.
语音信号非线性特征的研究   总被引:4,自引:0,他引:4       下载免费PDF全文
随着研究的深入,语音信号的非线性特征逐渐被人们发现,传统的基于分段线性的语音信号处理方法存在局限性,因此用非线性方法对语音信号进行处理对于提高处理质量相当重要。文章介绍了非线性理论在语音信号处理中的一些应用,首先采用延时相图法重构语音的混沌吸引子,然后用分形维数、Lyapunov指数等非线性动力学参数反映语音信号的非线性特征,设计计盒维数算法并行运用于语音分割,最后根据语音信号时域波形分形结构设计  相似文献   

15.
基于Haar小波提升的2.4kbit/s CWI语音编码算法   总被引:1,自引:0,他引:1  
提出一种基于Haar小波提升的2.4 kbit/s特征波形内插(CWI)语音编码算法.将特征波离散时间傅里叶级数(DTFS)得到的幅度谱转化为离散余弦变换(DCT)系数,用Haar小波提升实现特征波的多级分解与重建.利用相位谱间距的均值和基音周期增益联合判断浊音度标志,用于进行相位选择和离散余弦变换系数的选择性量化.主观A-B听音实验表明,该语音编码算法音质优于传统的3.8 kbit/s CWI编码器,在较低码率上获得较为满意的合成音质,且Haar小波提升特征波形分解与重建方法解决了传统小波变换CWI算法延时较大的问题.  相似文献   

16.
基于改进S变换的语音信号时频分析   总被引:2,自引:0,他引:2  
STFT分辨率固定,小波变换会出现局部相位信息且时间-尺度关系不适合直观视觉分析。提出基于改进S变换的语音信号时频分析。样条小波作为小波变换母小波乘以相位因子得到改进S变换,具有多分辨率和相位因子,并适合直观视觉分析。仿真实验得到的时频分布结构图与STFT、小波变换分布比较,显示改进S变换时频结构更加细致。  相似文献   

17.
在对最新的MPEG4中的音频编码中码激励线性预测CELP(code excited linear predicive)编码器分析和研究的基础上,根据其窄带语音编码器的参数模式,建立和实现了一个基于CELP的语音编码实验系统,将高效的CELP编码技术应用于文语转换TTS(text-to-speech)系统中语音数据库的压缩,效果是满意的。  相似文献   

18.
一种基于小波变换的语音增强新方法   总被引:3,自引:0,他引:3  
根据随机噪声的小波变换系数在不同尺度上的传递特性和噪声信号奇异性与小波模极大值的关系,提出用一个随尺度变化的软阈值来抑制带噪语音信号在不同尺度上的噪声小波系数的语音增强方法.实验结果表明:该方法既能减小语音畸变,又能有效地去除噪声,具有较好的语音增强效果.  相似文献   

19.
This paper describes the latest version of the Chinese-Japanese-English handheld speech-tospeech translation system developed by NICT/ATR, which is now ready to be deployed for travelers. With the entire speech-to-speech translation function being implemented into one terminal, it realizes real-time, location-free speech-to-speech translation. A new noise-suppression technique notably improves the speech recognition performance. Corpus-based approaches of speech recognition, machine translation, and speech synthesis enable coverage of a wide variety of topics and portability to other languages. Test results show that the character accuracy of speech recognition is 82%-94% for Chinese speech, with a bilingual evaluation understudy score of machine translation is 0.55-0.74 for Chinese-Japanese and Chinese-English  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号