期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

胡笑浒王世伟郑成诗李晓东《科学技术与工程》2013,13(21):6111-6117

提出一种应用于单通道语音增强技术的倒谱预处理算法。倒谱预处理通过抑制语音中浊音的谐频成分,避免在非平稳噪声跟踪过程中将语音浊音信号功率谱错误估计成噪声功率谱;同时预处理还能增加语音间隙出现的概率,跟踪搜索窗内信号能量最小值时更有效地跟踪到噪声能量电平。实验结果表明应用文中提出的预处理算法后,快速有效跟踪噪声的同时能避免噪声功率谱过估,并且在客观评价指标方面得到更高的段信噪比提高量(SegSNRI:Segmengtal Signal-to-Noise Ratio Improvement)和感知语音质量评价(PESQ:Perceptual Evaluation of Speech Quality)得分改善量。相似文献

2.

基于倒谱修正模型的语音基音检测算法

曾毓敏吴镇扬《南京理工大学学报(自然科学版)》2007,31(4):503-508

该文提出了一种基于修正倒谱模型的改进的倒谱基音检测算法.该算法首先对分帧语音进行10阶线性预测编码(LPC)分析和逆滤波,获得LPC预测残差;然后对残差信号进行倒谱分析,倒谱分析中采用了离散傅里叶变换频谱的高频分量置零的计算措施;最后根据倒谱的特征求得浊音语音的基音周期.仿真检测结果表明:该算法无论对纯净语音,还是对不同加噪情况下的含噪语音,其基音检测结果都明显优于传统倒谱基音检测算法,并且也明显优于基于平均幅度差函数的基音检测算法,而略优于基于自相关函数的基音检测算法. 相似文献

3.

基于LP-MMSE的高效语音感知哈希认证算法

《华中科技大学学报(自然科学版)》2016,(12):127-132

为了满足移动语音通信中对语音内容保持操作的鲁棒性和区分性,并实现高效认证等要求,提出一种基于线性预测最小均方差(LP-MMSE)的高效语音感知哈希认证算法.该算法首先对待认证语音进行预处理、分帧和加窗后的语音信号进行线性预测分析(LPC)得到其最小均方差(MMSE)系数矩阵;然后对分帧后的语音利用谱熵法计算得到每帧的谱熵值参数矩阵;最后结合上述两个矩阵,生成最终的二进制感知哈希序列.仿真结果表明,该算法的感知哈希摘要性优于现有的其它方法并对内容保持操作具有较好的鲁棒性和区分性,认证效率高,能够满足语音通信实时认证的要求. 相似文献

4.

一种基于修正倒谱平滑技术改进的维纳滤波语音增强算法

李季碧马永保夏杰刘金刚《重庆邮电大学学报(自然科学版)》2016,28(4):462-467

传统的倒谱平滑维纳滤波算法在求取选择性平滑范围时,噪声会对维纳增益函数的倒谱产生影响,使估计出的选择性平滑范围不正确,进而导致此传统算法在平滑掉音乐噪声的同时也影响了噪声抑制效果。为此提出了一种基于修正倒谱平滑技术改进的维纳语音增强算法,该算法先用最大似然准则估计出纯净语音的倒谱,然后在纯净语音倒谱中求取基频和共振峰的位置,进而得到选择性平滑的范围。该方法提高了选择性倒谱平滑的准确性,进而改善了传统倒谱平滑维纳滤波语音增强算法的噪声抑制效果。最后在不同的噪声场景中对传统算法和改进算法进行了仿真对比,表明该算法能够在去除噪声的同时更好地保留语音的特征结构,较好地提高了带噪语音的质量。相似文献

5.

一种利用线性预测残差的语音去噪方法

张江安杨洪柏林良明颜国正《上海交通大学学报》2002,36(7):1021-1025

提出了一种利用线性预测残差去除语音中加性白噪声的方法 .含噪语音经过线性预测分析后 ,所得的线性预测残差可分为与语音相关的语音残差部分和与噪声相关的噪声残差部分 .当噪声为白噪声时 ,噪声残差能量与噪声能量的比值大于语音残差能量与语音能量的比值 ,并且随着含噪语音信噪比的增大 ,两者数值上的差距越来越大 .因此 ,从含噪语音中按一定比例 λ(0 <λ<1 )减去预测残差 ,即可抑制噪声残差能量 .这实际上抑制了含噪语音中的噪声能量 ,提高了其信噪比 ,从而达到在一定程度上去噪的目的 .同时 ,这样处理造成的语音能量损失是有限的 .特别是 ,上述方法中对语音成分的操作仅仅在预测残差内进行 ,对语音的共振峰影响很小 ,因而能够较好地保留语音信号的频谱结构 ,使语音品质不致降低 .实验结果表明 ,该方法简便而有效相似文献

6.

基于语音压缩感知观测序列语音能量估计及端点检测方法

王文娟《南京邮电大学学报(自然科学版)》2013,33(3)

根据压缩感知理论,文中分析了基于压缩感知观测序列语音能量估计的理论基础,并对不同压缩比下语音能量估计的准确度仿真结果做对比,然后将得到的语音能量估计做为语音端点检测的基础,分别对粉红噪声、高斯噪声和汽车噪声情况下不同信噪比的语音进行端点检测,并与基于压缩感知观测序列倒谱距离、传统的奈奎斯特采样中能量的语音端点检测方法做对比,减少了计算量. 相似文献

7.

基于倒谱处理的先验信噪比估计算法

王杰《科学技术与工程》2017,17(3)

单通道语音增强中,已有的先验信噪比算法能有效地去除噪声,提升语音增强算法性能;但是由于在噪声功率谱估计不准确,造成噪声功率出现过估和低估的情况,造成了语音失真和保留较多残留噪声。通过倒谱处理能在含噪语音段中抑制语音中的谐频成分和在纯噪声段中避免部分较强的噪声成分误判为语音信号,准确地估计出噪声功率谱,同时语音失真不大。在多种噪声背景下的客观评价指标分析表明,经过倒谱处理后的先验信噪比估计算法能提高先验信噪比算法的估计性能。相似文献

8.

基于VTS的稳健语音识别

赵贤宇欧智坚王作英《清华大学学报(自然科学版)》2005,45(7):892-895

为了进一步提高矢量Taylor级数(VTS)算法的模型补偿精度以及在噪声环境下的识别性能,提出将无监督聚类与VTS算法相结合。无监督聚类算法利用噪声模型之间的Kullback-Leibler距离将含噪语音段划分为若干个子段。然后针对各个子段分别进行一阶Taylor级数展开,并在此基础上逐段估计噪声参数和补偿声学模型。该算法结合一个中文数字串识别系统进行实验,在Babble噪声和Gauss白噪声环境下该算法的误识率相对传统的VTS算法分别下降了27.7%和17.8%。证明这种结合无监督聚类的分段VTS算法能够更加有效地将语音和噪声在倒谱域上的非线性混合模型用一阶线性模型来近似。相似文献

9.

用于抗噪声语音识别的谐振强度特征

许超曹志刚《清华大学学报(自然科学版)》2004,44(1):22-24

基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。相似文献

10.

浴室噪声环境下小词汇量语音识别系统研究

童强黄剑王永骥《华中科技大学学报(自然科学版)》2011,39(Z2):309-311

根据实际应用的需求,设计了一种在浴室噪声环境中的小词汇量的语音识别系统.针对特定的浴室噪声进行分析,引入一种语音增强算法来降低噪声对识别的影响.使用基于人耳听力模型的mel频率倒谱特征参数作为语音特征参数,并结合其一阶差分参数描述语音信号特征的动态特性.针对小词汇量的实际应用需求,选用基于动态时间规整的模板匹配方法来识别.该方法可以用于其他相似的噪声环境中,通过实验验证了该方法的可行性. 相似文献

11.

语音增强新方法的研究

王振力张雄伟白志强《南京邮电大学学报(自然科学版)》2007,27(2):10-14

对带噪语音信号进行增强处理,是语音信号处理中一个重要的研究课题.从算法提出的背景和算法性能分析两个方面对以下4种语音增强新方法进行了概括总结,即自适应滤波算法、分数阶谱相减法、小波域阈值法和语噪盲源分离算法.与传统的语音增强方法相比,实验数据表明这些新方法具有更好的降噪性能. 相似文献

12.

有噪语音的线性预测HMM参数估计方法

谢锦辉黄载禄万发贯《华中科技大学学报(自然科学版)》1991,(Z1)

本文讨论了混有加性高斯白噪声的语音的线性预测隐Markov模型(HMM)参数估计问题.由Baum等人提出来的重估公式没有考虑噪声的影响,因此,对有噪语音的模型参数估计会产生较大的偏差.本文对该公式提出了一种修正方案,用这种方法估计出的模型参数有效地抑制了噪声的影响,较准确地反映了语音真实时变特征.实验证实了这一结论. 相似文献

13.

基于递归最小追踪的噪声互功率谱估计算法 总被引：1，自引：1，他引：0

张正文赵晓晴尹波《科学技术与工程》2016,16(10)

针对改进最小追踪噪声互功率谱估计方法存在的噪声过估计的问题。提出一种基于递归最小追踪的噪声互功率谱估计算法。该方法中的平滑因子使用了递归平均技术,在估计噪声互功率谱时,会根据每个频点的实际信噪比作相应的调整。仿真结果表明,该噪声估计算法应用于一个语音增强系统时,取得了较小的噪声均方估计误差及较好的感知语音质量评价(PESQ)得分。相似文献

14.

基于子带能量线性映射的噪声中端点检测算法 总被引：8，自引：0，他引：8

田野王作英陆大《清华大学学报(自然科学版)》2002,42(7):953-956

研究噪声环境下的语音端点检测问题。在低信噪比下 ,虽然噪声和语音的频谱分布不同 ,但是传统语音检测算法使用的时域能量没有描述能量在各频域子带的分布 ,对于语音和噪声没有很好的区分性。以前提出的基于时间 -频率的能量参数利用频域的限带能量加上时域能量来进行噪声中的语音检测。但是它们选择频带的依据是语音信号的高能量子带 ,而没有考虑噪声的子带能量分布。该文提出的语音检测方法同时考虑语音和噪声的频域能量分布 ,采用线性映射的方法将 Mel滤波器组的子带能量特征空间映射到噪声和语音最有区分性的一维子空间 ,得到新的特征参数 EL MBE进行语音检测。实验结果表明 ,在噪声环境下基于线性映射的能量参数比时域能量 ,基于时间 -频率的能量有更好语音检测性能。相似文献

15.

关于短延时码本激励线性预测编码方案的改进

赵俊温启荣《重庆邮电学院学报(自然科学版)》1997,9(3):31-33,30

在短延时码本激励线性预测语音编码方案中，直接用Ｇ．７２８所提供的现成码本时对加噪声后的语音信号进行编解码时，效果不好，作者利用ＬＢＧ算法训练了自己的码本，并利用此码本对加噪声后的语音信号进行编解码，取得了良好的效果，使主观感觉质量变好，信噪比提高了约３ｄＢ。相似文献

16.

RASTA滤波在语音通信质量客观评价中应用的研究 总被引：2，自引：0，他引：2

王炜刘峰吴淑珍《北京大学学报(自然科学版)》2003,39(5):697-702

介绍了在语音通信质量客观评价中使用RASTA（Relative Spectra）滤波的研究结果。通过分别将RASTA滤波与感知线性预测（PLP,Perceptually Linear Prediction)方法和美倒谱（MFCC,Mel Frequency Cepstral Coefficient)方法相结合对通过短波或超短波信道的男女生文件进行拟合研究,均取得了比较好的效果。与PLP方法结合关系数提高了12％,与MFCC方法结合相关系数提高了4％。说明RASTA滤波对信道噪声的低频成分中人耳听不到的部分进行过滤的方法在语音通信质量客观评价中是有效的。相似文献

17.

对Itakura语音失真测度的改进

陈国胡修林张蕴玉朱耀庭《华中科技大学学报(自然科学版)》1999,(10)

提出了一种对Ｉｔａｋｕｒａ语音失真测度的改进方法——感知谱失真（ＰＳＤ）测度方法,该方法通过模拟人的听觉特性把语音短时谱转变为符合听觉特性的感知谱,再以感知谱为基础,结合Ｉｔａｋｕｒａ测度的优点来度量语音失真程度．通过对不同质量的语音信号进行仿真实验以及与Ｉｔａｋｕｒａ测度方法作对比实验,结果表明ＰＳＤ测度克服了Ｉｔａｋｕｒａ测度的不足,与语音质量的主观评价一致性较好,特别是在语音失真程度较大时ＰＳＤ测度明显优于Ｉｔａｋｕｒａ测度．相似文献

18.

一种宽带带通三维频率选择表面设计及分析

于正永朱建平唐万春《兰州理工大学学报》2021,47(3):86

基于方形波导结构提出了一种宽带带通三维频率选择表面(3D FSS).所提出的FSS的单元结构由上下端面刻蚀两个相同正方形金属贴片的介质方块和空气方形波导组成,此时每个端面形成了方形槽谐振单元.在电磁耦合作用下,方形槽谐振单元原有单一的谐振模式耦合分裂为奇模和偶模两种谐振模式,由此产生了两个传输极点,从而形成了一个平坦的二阶通带,且通带3 dB相对带宽为25.12%.通过等效电路模型,阐明了该FSS的工作原理.仿真结果显示:在TE和TM两种极化方式下,以0°到45°角度入射时所提出的FSS具有稳定的频率响应.此外,该3D FSS还具有相对较小的单元结构. 相似文献

19.

高质量4kbit/s码速率语音编码算法研究

唐昆崔慧娟刘志勇冯重熙《清华大学学报(自然科学版)》1999,39(5):geMap1

４ｋｂｉｔ／ｓ有限状态代数码激励线性预测语音编码算法ＦＳ－ＡＣＥＬＰ是一种具有延时较短、合成语音质量高、算法复杂度较低的语音编码算法。在线性预测（ＬＰ）参数量化上,利用了语音帧内和帧间的相关性,对线谱对（ＬＳＰ）参数使用预测式分裂式矢量量化,获得很高的量化效率。在自适应码本搜索上,采用了有限状态控制分数延时搜索的算法,在保证合成语音质量的同时,有效地降低了运算量。对于随机码本,采用了具有多模结构的代数码本,提高语音合成质量。对于激励码序列的增益,采用了预测式矢量量化,有效地提高了量化精度。经非正式听音测试,４ｋｂｉｔ／ｓＦＳ－ＡＣＥＬＰ的合成语音质量超过了北美８ｋｂｉｔ／ｓＶＳＥＬＰ,接近Ｇ．７２９８ｋｂｉｔ／ｓＣＳ－ＡＣＥＬＰ,ＭＯＳ分约为３．９。相似文献

20.

基于非负矩阵分解和长短时记忆网络的单通道语音分离

崔建峰邓泽平申飞史文武《科学技术与工程》2019,19(12)

为了解决语音分离中非负矩阵分解(non-negative matrix factorization,NMF)、深度神经网络(deep neural network,DNN)等算法没有考虑语音时序相关性的问题。结合NMF和长短时记忆网络(long short-term memory,LSTM)算法提出NMFLSTM单通道语音分离算法:将语音信号的幅度谱作为模型的输入特征,通过训练NMF和LSTM模型获得目标语音的基矩阵和系数矩阵,并对其结果进行语音重构最终实现语音分离。实验结果表明:相比于未考虑语音时间连续性的算法,使用NMFLSTM算法分离语音的客观语音质量评估值(perceptual evaluation of speech quality,PESQ)有明显提升,其最大值超过3. 1,获得良好的分离效果。相似文献