首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
语音增强技术在低速语音编码中的应用   总被引:1,自引:1,他引:0       下载免费PDF全文
在语音编码的应用环境中,特别是在军事应用中,强噪声环境下声码器性能的改进是一个亟待解决的问题。在研究语音增强技术的基础上,将语音增强技术于低速语音编码,有效地改善了低速语音编码算法的抗背景噪声的性能。并利用所构建的语音质量客观评价平台,对语音增强低速编码算法的抗背景噪声性能进行了客观评估与分析。  相似文献   

2.
为了提高在噪声环境下的语音识别性能,提出一种融合信号级和特征参数级抗噪的抗噪算法.该算法首先对带噪语音用最小均方误差估计法进行语音增强,后端对原始的带噪语音运用自相关法,以有效抑制加性和卷积噪声.实验结果表明,该算法能有效提高系统在噪声环境下,特别是低信噪比情况下的识别率.  相似文献   

3.
一种基于奇异值分解的带噪语音识别方法   总被引:3,自引:3,他引:0  
提出了一种抗噪声的语音识别方法,用于训练和用于测试的语音信号在提取特征之前,均需经过相同的奇异值分解滤波,本文还提出了一种滤波参数的选取方法,实验证明,采用这种方法可以大幅度提高传统隐马尔可夫模型语音识别系统的抗噪声性能。  相似文献   

4.
主要研究用于分布式语音识别(DSR)的语音参数的提取方法以及参数性能分析。以前所用到的语音参数大部分是LPC倒谱参数,但其抗噪声性能较差。文中主要讨论了MEL倒谱参数,并在移动通信环境下,比较了两者的性能。  相似文献   

5.
为了解决格型结构对噪声敏感的问题,从基于高阶累积量的均方误差(CMSE)准则出发,提出了一种基于高阶累积量的格型(CL)结构,并讨论了该结构具有的一些重要性质。在此基础上进一步推证了系统参数辨识的基于高阶累积量的Burg算法(CBurg),并给出了三阶CBurg算法的一种快速递归实现方案。仿真结果证明:就辨识结果的无偏性而言,这种CBurg算法的抗高斯噪声性能明显优于常规Burg算法而两种算法的运算量大体相当。  相似文献   

6.
含噪语音信号中噪声参数的一种估计方法   总被引:2,自引:1,他引:1  
为了提高含噪语音信号中噪声参数估计的实时性,利用语音信号的短时平稳性,提出了一种无需对含噪语音信号进行有声/无声检测的噪声参数估计法。仿真实验表明,该方法计算效率高、噪声参数估计的实时性,即使是噪声特性随时间缓慢变化也可得到良好的估计结果,可以方便地溶入到基于短时谱幅度估计的语音增强处理中。  相似文献   

7.
基于G.729A和AES的分组语音保密通信   总被引:1,自引:0,他引:1  
AES分组密码由多轮迭代的轮函数构成,对轮函数包括的4个面向字节的变换:字节变换、行移位、列混合和加载子密钥作简要介绍和分析;并简要描述了G.729A的编码、解码器的工作流程和参数结构.由于AES标准仅支持128bit的分组加密,而G.729A语音编码帧的大小为80bit,所以不能直接应用AES来加密G.729A的编码语音来实现语音保密通信,在不损害AES的安全强度下,提出两个适用于加密G.729A编码语音帧的AES修正方案:AES160和AES80,根据分组密码的随机性测试、明密独立性测试、雪崩效应测试分析AES160和AES80密码统计性能,测试结果表明AES160和AES80都有优秀的密码学统计性能,最后利用随机误码,分析基于G.729A和AES的语音保密通信系统的抗误码性能,结果表明AES160和AES80适用于加密G.729A的语音编码帧,并保留了AES的密码安全性能。  相似文献   

8.
基于语音编码系统的语音识别,由于受编码的影响其识别效果在编码速率下降时显著降低。传统的识别方法从重构语音波形中提取特征参数,并针对该特征参数进行训练和识别。比较了基于编码语音的识别准确率和基于编码参数的识别准确率,并研究了编码参数对识别准确率的影响。在此基础上,通过选择受编码影响较小的编码参数,直接将LPC参数和残差信号参数组合起来构成特征参数进行语音识别。实验结果表明,采用这种方法的AMR语音识别系统,其识别效果接近于基于原始语音的识别效果。  相似文献   

9.
为了在保证语音增强算法性能的同时,降低算法复杂度,提出了一种巴克域最小统计量控制递归平均噪声估计算法.将带噪信号在巴克域进行分解并进行最小统计量分析,基于此最小统计量控制噪声的递归平均估计.算法基于听觉模型,充分利用巴克带内频带间的相关性,具有较好的噪声跟踪估计性能.该算法复杂度低,适用于常见语音增强方法.仿真结果表明,基于该噪声估计的语音增强可以有效地抑制噪声,增强后语音失真较小,在低信噪比条件下能够有效改善语音编码合成后的语音质量.  相似文献   

10.
本文设计了一个2.4kb/s的语音分析算法,并详细介绍了算法中的技术细节。对语音的分析采用LPC分析方法,以语音能量、基音周期以及10个部分相关系数作为一帧语音的参数。在分析算法中采用杜宾递推公式求取部分相关系数,采用并联时域基音检测技术提取基音周期。通过删除语音间隙及进行自动增益控制等措施来提高语音参数的精确度,对语音参数进行编码以达到2.4kb/s的传输率的要求。  相似文献   

11.
基于语音信号短时平稳性以及语音信号和噪声的统计模型,提出了一种语音信号有声/无声的检测方法。该方法可对所有语音短时帧更新噪声参数的估值,因而提高了检测的准确性,根据噪声参数以及语音和噪声的统计特性定义了似然比,确定了有声/无声的判别准则,研究了判别阈值、平滑因子等参数以及缓变非平稳背景噪声对检测结果的影响。实验结果表明,即使背景噪声具有缓变特性,利用该方法仍可得到良好的检测结果。对不同的应用,在检测过程中判别阈值的选取应结合平滑因子进行必要的优化。  相似文献   

12.
文章涉及了语音编码中最新的一种编码方式——变速率语音编码。语音激活检测 (VAD)算法是其中的关键部分 ,直接影响语音质量和试听效果。文章通过分析国际电信联盟的 G.72 9B标准 ,提出了一种适用于三速率语音编码方式的VA D算法。该算法结合了声学分类 ,对噪声、清音和浊音加以区分 ,最后给出了仿真结果 ,证明其稳健性和有效性  相似文献   

13.
一种基于ACELP的4.8kb/s高质量语音编码算法   总被引:1,自引:1,他引:0       下载免费PDF全文
介绍了一种基于代数码激励线性预测(ACELP)的4.8kb/s语音编码算法。首先对算法进行了概述,然后分别对算法所采用的基音周期估计,基音预测,代数码本结构以及代数码本搜索方式进行了介绍。重点对算法所采用的代数码本搜索技术进行了详细分析。定点C语言模拟结果表明,该算法在4.8kb/s速率上可以合成很高音质的话音。  相似文献   

14.
针对谱减法增强语音后残留"音乐噪声"明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法.通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声.仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果.  相似文献   

15.
Automatic speech recognition under conditions of a noisy environment remains a challenging problem. Traditionally, methods focused on noise structure, such as spectral subtraction, have been employed to address this problem, and thus the performance of such methods depends on the accuracy in noise estimation. In this paper, an alternative method, using a harmonic-based spectral reconstruction algorithm, is proposed for the enhancement of robust automatic speech recognition. Neither noise estimation nor noise-model training are required in the proposed approach. A spectral subtraction integrated autocorrelation function is proposed to determine the pitch for the harmonic model. Recognition results show that the harmonic-based spectral reconstruction approach outperforms spectral subtraction in the middle- and lowsignal noise ratio (SNR) ranges. The advantage of the proposed method is more manifest for non-stationary noise, as the algorithm does not require an assumption of stationary noise.  相似文献   

16.
针对谱减法增强语音后残留音乐噪声明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法。通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声。仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果。  相似文献   

17.
一种基于听觉掩蔽效应的语音增强方法   总被引:6,自引:1,他引:5  
为提高增强语音的听觉效果 ,研究了一种基于听觉掩蔽效应的语音增强方法。推出了一个功率谱域的基于听觉掩蔽效应的不等式准则 ,并用这个准则动态地选择一个作为语音短时谱幅度估计器的非线性函数的参数值 ,通过这个参数自适应变化的非线性函数对语音谱幅度进行估计实现语音增强。在此基础上 ,设计实现了一个单声道语音增强算法。对增强语音的客观测试和非正式听音测试表明 :相对于传统的减谱法和对数短时谱幅度最小均方误差估计增强法 ,基于听觉掩蔽效应的语音增强方法能更好地抑制背景噪声  相似文献   

18.
吴兰  杨攀  李斌全  王涵 《广西科学》2023,30(1):52-60
视听语音识别(Audio-Visual Speech Recognition,AVSR)技术利用唇读和语音识别(Audio-Visual Speech Recognition,AVSR)的关联性和互补性可有效提高字符识别准确率。针对唇读的识别率远低于语音识别、语音信号易受噪声破坏、现有的视听语音识别方法在大词汇量环境噪声中的识别率大幅降低等问题,本文提出一种多模态视听语音识别(Multi-modality Audio-Visual Speech Recognition,MAVSR)方法。该方法基于自注意力机制构建双流前端编码模型,引入模态控制器解决环境噪声下音频模态占据主导地位而导致的各模态识别性能不均衡问题,提高识别稳定性与鲁棒性,构建基于一维卷积的多模态特征融合网络,解决音视频数据异构问题,提升音视频模态间的关联性与互补性。与现有主流方法对比,在仅音频、仅视频、音视频融合3种任务下,该方法的识别准确率提升7.58%以上。  相似文献   

19.
语音信息的采集过程中难免会有各种噪声的干扰,噪声降低了语音的可懂度及清晰度,甚至严重影响语音处理的准确性和可靠性。谱减法是语音减噪中最常用的方法,该方法基于人的感觉特性,对语音短时幅度谱进行估计,适用于受加性噪声污染的语音。本文通过统计分析谱减法的增益补偿因子和过减因子参数,研究基于谱减法的藏语语音减噪处理,并取得较为理想的实验结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号