首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
本文提出了一种新的线性预测编码(LPC)方法。它既可用于纯语音分析,也可用于噪化语音分析。用于噪化语音分析时,首先在无语音帧内估计出噪声样本的自相关系数,然后从噪化语音的自相关系中减去噪声的自相关系数,最后利用估值得到的语音自相关系数求出它的线性预测系数。当输人噪化语音的信噪比为0~10dB时,使用这种方法可以提高信噪比5dB左右。  相似文献   

2.
提出了一种利用线性预测残差去除语音中加性白噪声的方法 .含噪语音经过线性预测分析后 ,所得的线性预测残差可分为与语音相关的语音残差部分和与噪声相关的噪声残差部分 .当噪声为白噪声时 ,噪声残差能量与噪声能量的比值大于语音残差能量与语音能量的比值 ,并且随着含噪语音信噪比的增大 ,两者数值上的差距越来越大 .因此 ,从含噪语音中按一定比例 λ(0 <λ<1 )减去预测残差 ,即可抑制噪声残差能量 .这实际上抑制了含噪语音中的噪声能量 ,提高了其信噪比 ,从而达到在一定程度上去噪的目的 .同时 ,这样处理造成的语音能量损失是有限的 .特别是 ,上述方法中对语音成分的操作仅仅在预测残差内进行 ,对语音的共振峰影响很小 ,因而能够较好地保留语音信号的频谱结构 ,使语音品质不致降低 .实验结果表明 ,该方法简便而有效  相似文献   

3.
基于线性预测的自适应语音增强技术   总被引:1,自引:0,他引:1  
提出了一种基于线性预测的自适应语音增强方法。该方法利用带噪语音的线性预测作为自适应滤波器的参考输入,使有色噪声的相关性隐含于参考输入之中,从而大大地提高了语音的信噪比。仿真实验证明.被环境噪声污染了的语音信号经自适应系统处理后,其信噪比提高了32.70dB。  相似文献   

4.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别   总被引:1,自引:0,他引:1  
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率.  相似文献   

5.
一种噪声环境下的语音识别方法(线性预测误差法)的研究   总被引:4,自引:0,他引:4  
介绍一种平稳噪声环境下语音识别的新的方法。该方法利用噪声的LPC系数去预测语音信号,从而得到LPC预测序列,然后把它代替原语音序列来进行语音端点的检测、语音特征的提取和在合适的匹配方式下的识别。实验结果表明:该法在噪声环境下自动检测语音端点和提取语音信号的特征是可行的,获得了很满意的识别率。  相似文献   

6.
基于单边自相关线性预测噪声中汉语语音识别   总被引:4,自引:1,他引:3  
对含噪语音在自相关域上进行处理,以其自相关函数值为参数进行端点检测,以基于单边自相关序列的LPC倒谱系数作为语音的特征参数进行语音识别,实验表明:这种方法较好地消除了噪声对语音信号的干扰,并获得了较高的识别率。在信号的信噪比低而自相关性又强时,此法能体现出不同一般的优势,为实际应用提供了可能。  相似文献   

7.
线性预测编码(Linear Predictive Coding)是实现语音编码的一项重要技术.通过对语音信号和LPC的研究,介绍了语音信号的线性预测分析原理,详细分析用来求解线性预测方程的自相关法和计算方法,并用Matlab对实际语音信号进行线性预测编码实验.实验结果表明,应用LPC法合成的语音信号误差小、计算简单、合成速度快.  相似文献   

8.
基于FSS与PLP的噪声鲁棒语音识别   总被引:1,自引:0,他引:1  
提出了一种基于分数阶谱相减(FSS)与感知线性预测(PLP)相结合的噪声鲁棒语音识别方法,记为FSS PLPC.该方法首先通过FSS在分数阶Fourier域对带噪语音进行降噪处理,然后计算增强语音的均方误差和Itakura距离并进行比较,以获得FSS的近似最优分数阶阶数.最后对根据此阶数得到的增强语音提取感知线性预测倒谱(PLPC).实验结果表明,FSS PLPC对于数字语音的识别性能优于传统的谱减法(SS PLPC)和感知线性预测倒谱(PLPC)法,并且随着信噪比的降低FSS PLPC表现出较好的噪声鲁棒性.  相似文献   

9.
语音信号中经常混有加性噪声,噪声的存在会使语音处理系统的性能急剧下降,因此语音去噪是语音信号处理中的关键技术之一.提出一种利用线性预测残差去除语音中的加性白噪声的方法,实验结果表明,该方法可以有效地去除语音信号中的加性白噪声,并且保持语音信号较好的清晰度和可懂度.  相似文献   

10.
在短延时码本激励线性预测语音编码方案中,直接用G.728所提供的现成码本时对加噪声后的语音信号进行编解码时,效果不好,作者利用LBG算法训练了自己的码本,并利用此码本对加噪声后的语音信号进行编解码,取得了良好的效果,使主观感觉质量变好,信噪比提高了约3dB。  相似文献   

11.
本文对数字语音信号s(n)在语音识别过程中的信号预处理阶段使用加窗函数w(n),从引入误差到LPC分析的实用性算法进行了分析,对使用w(n)的必要性和选择进行了讨论。从实践中证实了当语音样点数N与LPC预测阶数P在短时分析中达到N(?)P时,使用s_w(n)及LPC正则方程的高效递推算法较使用s(n)时的算法在维吾尔语语音识别中达到很好的识别效果,提高识别率达3~4个百分点。识别系统实时性有很大的提高。  相似文献   

12.
结合动态谱特性的语音识别研究,阐述了一种有限状态矢量量化(FSVQ)方法。FSVQ利用了过去的信息来选择合适的码本进行编码,对于语音识别更为有效。改进了所使用的语音特征参量,除了LPC倒谱系数外,结合使用了动态谱特征和能量的对数值,并根据汉语发音特征对语音信号端点进行一种加权处理。实验结果表明:与说话人有关的孤立词识别率达到98%。  相似文献   

13.
基于预测神经元模型的语音线性预测系数求解新方法   总被引:1,自引:0,他引:1  
采用预测神经元作为语音信号线性预测模型的一种实现形式,可将线性预测系数的求解问题转化为预测神经元的训练问题,并运用BP算法得到了[神经元权值(即线性预测系数)的递推计算公式,考虑到语音信号能量的不确定性,提出了运用相对预测误差能量作为判断的参数,并按清音和浊音中两种情况讨论了收敛判据,由于利用预测神经元的迭代训练算法,理论上可以最大限度地挖掘语音样本中的相关性,因而可得到非常精确的线性预测系数,计算结果表明,运用预测神经元方法所得到的线性预测系数,精度明显高于传统的杜宾算法和格型算法。  相似文献   

14.
针对某些语音LPC(L inear Pred iction Cod ing)分析的缺陷提出一种改进算法。该算法重点研究经典LPC分析后基音激励方向向下的语音,对这种浊音LPC残差进行后滤波以取代预增强的方法使其逼近语音激励。该算法将传统LPC分析中的声道模型和声门模型分开考虑,既避免了引入ARMA模型难以计算的缺陷,同时又显著的抵消了声门模型中极点的影响。实验表明,该算法对经典LPC分析后基音激励方向反向的语音,改善效果明显,残差的方向性与理论分析更加吻合。最后将该方案应用于语音水印的研究中,具有一定实用性。  相似文献   

15.
本文设计了一个2.4kb/s的语音分析算法,并详细介绍了算法中的技术细节。对语音的分析采用LPC分析方法,以语音能量、基音周期以及10个部分相关系数作为一帧语音的参数。在分析算法中采用杜宾递推公式求取部分相关系数,采用并联时域基音检测技术提取基音周期。通过删除语音间隙及进行自动增益控制等措施来提高语音参数的精确度,对语音参数进行编码以达到2.4kb/s的传输率的要求。  相似文献   

16.
语音增强用于抗噪声语音识别   总被引:12,自引:1,他引:11  
语音识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的 ,则语音识别系统可以令人满意地工作。然而 ,当实际环境中有噪声存在时 ,语音识别系统性能急剧下降。为了让语音识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能 ,研究了一个将语音增强器和语音识别器级连起来的系统。该系统中 ,语音增强作为前端处理用于提高识别器输入端信号的信噪比。通过 3种不同的增强算法用于纯净语音和3种类型带噪语音的实验结果分析比较表明 ,这一方法对纯净语音的识别精度几乎没有任何改变而大大提高了系统的抗噪声性能  相似文献   

17.
频谱包络转换是语音转换中的一项重要内容,基于双线性转换函数进行频谱搬移的方法可以有效的进行谱包络转换,并且基于小语料库训练时仍能得到稳定的转换谱包络。本文基于LPC分析,在求解频谱搬移后的系统单位冲激响应的基础上,提出求解频谱搬移后LPC系数的方法,以此来实现频谱包络的变换,取得较好的效果。  相似文献   

18.
汪兰兰  蔡昌新 《科学技术与工程》2022,22(26):11524-11532
针对目前常见的语音特征提取方法应用于真实环境中,所提取的语音特征包含有噪声干扰的问题,进而导致情感识别时出现的分类模糊化情况,为此提出一种新的语音特征提取方法,即线性预测基音频率特征提取方法。它主要是基于线性预测系数来构建模型,利用构建的模型消除声道响应信息以及抑制噪声干扰。由于此方法对于分类模糊化问题没有得到较好改善,利用模型相同的LPCMCC(LPC Mel cepstral coefficients,LPC美尔倒频谱系数)来对线性预测基音频率进行改进,并设计基于线性预测基音频率、其改进特征、LPCMCC与SVM(support vector machines,支持向量机)的语音情感识别对比实验。对比实验表明,此改进特征提取方法应用在情感识别领域的平均精度最高为84%,比线性预测基音频率和LPCMCC要高出22%、14%。为了测试此改进特征在真实环境中的分类效果,在此改进特征的基础上设计了一种基于MATLAB GUI技术的语音情感识别系统。实验结果表明这种新的改进特征能有效改善情感识别时出现的分类模糊化情况,基于此改进特征的语音情感系统能广泛地识别出噪声干扰下的说话人情感。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号