期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

曾理《科技咨询导报》2010,(4):9-9

基音周期是语音参数编码中的重要参数。利用语音短时平稳性,提出了基于子帧参数动态规划的算法：每帧提取两组参数,帧间动态规划。仿真表明：对比传统算法,本方案更加准确;对于清浊音过渡帧的检测和基音倍频/半频错误有较好的改进作用。相似文献

2.

计哲李晔崔慧娟唐昆《清华大学学报(自然科学版)》2009,(8)

为解决正弦激励线性预测(SELP)2.4 kb/s语音编码算法中清浊音过渡时合成语音的质量较差的问题,该文利用子带清浊音判决参数量化过程中存在的冗余度,提出了一种跳跃帧判决及处理方法。该方法根据当前帧前后各60个样点的平均能量比值判定当前帧是否为跳跃帧,并利用子带清浊音判决参数量化的冗余度传送跳跃帧信息。解码端根据当前帧是否为跳跃帧对解码端参数采用不同的插值方案。测试结果表明,该方法能够将合成语音的M O S分提高0.004左右。相似文献

3.

SELP 2.4kb/s语音编码算法跳跃帧判决及处理

计哲李晔崔慧娟唐昆《清华大学学报(自然科学版)网络.预览》2009,(8)

为解决正弦激励线性预测(SELP)2.4kb/s语音编码算法中清浊音过渡时合成语音的质量较差的问题,该文利用子带清浊音判决参数量化过程中存在的冗余度,提出了一种跳跃帧判决及处理方法。该方法根据当前帧前后各60个样点的平均能量比值判定当前帧是否为跳跃帧,并利用子带清浊音判决参数量化的冗余度传送跳跃帧信息。解码端根据当前帧是否为跳跃帧对解码端参数采用不同的插值方案。测试结果表明,该方法能够将合成语音的MOS分提高0.004左右。相似文献

4.

基于SELP声码器的连续丢包隐藏算法

《清华大学学报(自然科学版)》2010,(12)

针对在连续丢包情况下声码器合成语音质量较差的问题,提出了一种特征参数的分模式线性预测技术。该方法利用参数的短时相关性,以子带清浊音参数为模式信息,计算各特征参数在不同模式下的预测系数,并根据获得的分模式预测系数用上一个正确接收帧的特征参数预测当前丢失帧的参数,最后用恢复的参数重建丢失语音帧。测试结果表明:当丢包长度的范围在75~200 ms时,与传统的抗丢包处理算法相比,该方法能够将合成语音的平均意见得分(mean opinion score,MOS)提高0.03左右。相似文献

5.

正弦激励线性预测声码器子带清浊音模糊判决 总被引：1，自引：0，他引：1

李晔洪侃王童崔慧娟唐昆《清华大学学报(自然科学版)》2008,48(7)

为了解决目前正弦激励线性预测声码器中各子带的清浊音硬判决使得语音帧间产生明显过渡感的问题,提出一种子带清浊音模糊判决算法,直接采用自相关函数对各子带的清浊音度进行描述,矢量量化后传输至解码端,用于激励信号的产生.测试结果表明: 采用子带清浊音模糊判决算法,能够消除语音帧间的过渡感,能够使各种速率正弦激励线性预测声码器的平均主观意见得分提高约0.05以上. 相似文献

6.

一种适于改进的LPC声码器的语音特征提取方法

陈雪勤《苏州大学学报(医学版)》2002,18(1):55-58

运用了一种较为有效的清、浊音判决方法以及基音平滑方法来提高基音检测的准确性 .减小了基音周期不规则的不平稳语音段基音估计的误差 ,改善了在低速率的基础上合成语音的质量相似文献

7.

语音模糊特征提取及码本训练算法

姜占才杨林《吉林大学学报(信息科学版)》2012,30(3):279-284

为克服低速率声码器因清浊音硬判决、粗判决而导致解码语音有帧过渡等不自然感的缺陷,在分析比较目前主流声码器编码算法中激励参数提取和量化算法的基础上,将模
糊数学中的隶属度概念引入语音子带清浊音描述。提出了五维的浊音隶属度矢量概念,用于精细描述语音丰富的激励信息;阐述了浊音隶属度矢量的提取算法;提出了矢量量化码本的模糊聚类与LBG级联训练算法（F-LBG：Fuzzy-LBG）;采用提取算法提取、建立了浊音隶属度码本的训练样本集,采用F-LBG训练了浊音隶属度码本;将提取算法和F-LBG法训练得到的浊音隶属度码本分别应用于正弦激励声码器、混合激励声码器和同态声码器的语音编、解码仿真。结果表明,用浊音隶属度矢量描述合成语音激励信号的算法,具有较高的准确性和较强的噪声鲁棒性。相似文献

8.

声码器清浊音判决算法优化 总被引：3，自引：1，他引：2

党晓妍魏旋崔慧娟唐昆《清华大学学报(自然科学版)》2008,48(7)

为了解决低速声码器合成语音的偶发性嘶哑或变调问题,对参数提取进行改善,采用有监督学习的Fisher判决法,利用多个特征值组成的特征向量为判据;基音周期平滑的准确度在利用了更准确的清浊音信息后大有提高.测试结果表明: 该算法能够大大降低清浊音误判率,减少严重基音周期错误数;应用该算法的SELP(sinuous excitation linear prediction) 2.4 kb/s的PESQ-MOS分优于2.4 kb/s的MELPe(mixed excitation linear prediction)和AMBE (advanced multi-band excitation)算法, DRT(diagnostic rhythm test)分数达95%, 具有良好的可懂度和自然度. 相似文献

9.

低信噪比下基于谱熵的语音端点检测算法 总被引：14，自引：0，他引：14

李晔张仁智崔慧娟唐昆《清华大学学报(自然科学版)》2005,45(10):1397-1400

为提高语音端点检测系统在低信噪(0 dB以下)下检测的准确率,提出了一种基于谱熵的端点检测算法。将每帧信号分为16个子带,选取频谱分布在250~3.5 kH z并且能量不超过该帧总能量90%的子带,计算经过语音增强后的子带能量以及各子带信噪比,根据各子带信噪比的不同调整其在整个谱熵计算过程中的权重,然后平滑谱熵,以最终的谱熵作为端点检测的依据。实验结果表明,此方法在较低的信噪比下能够显著地提高端点检测的准确率。对坦克噪声,检测效果明显优于G.729中的端点检测算法,即使在-5 dB的信噪比下,仍然可以达到95%以上的检测率。相似文献

10.

0.8 kb/s高质量声码器算法 总被引：11，自引：1，他引：10

李军林杜松崔慧娟唐昆《清华大学学报(自然科学版)》2003,43(1):12-15

随着通信的发展,对极低速率下语音压缩编码算法的需求越来越迫切.为满足极低码率的要求并获得高质量的合成语音,提出了一种高质量的0.8 kb/s 声码器算法.此算法基于传统的线性预测模型,利用多帧联合的超级帧参数分模式联合矢量量化技术,以及多带混合激励,子带清浊音参数相关预测,自适应谱增强,脉冲扩散后滤波等技术.主观听觉测试显示,此声码器在0.8 kb/s的速率下其合成语音不仅具有高可懂度而且具有一定的自然度,诊断押韵测试(DRT)的分数为85%,而且此声码器在10-2的随机误码的信道条件下仍然具有很好的可懂度. 相似文献

11.

基于矢量量化的语音信号频带扩展

郎玥赵胜辉匡镜明《北京理工大学学报》2005,25(3):260-264

对基于矢量量化的频带扩展方法进行了改进.在码本形成上提出了重新量化的方法,并用码本结合浊音度的方法调整增益.首先根据清浊度和能量被划分为标准将窄带输入信号清音、浊音和静音3类;然后每类信号选择不同的码本,用基于矢量量化的方法将窄带信号的谱包络转换成高频带信号的谱包络;再用激励信号(高斯白噪声信号)和重建的高频谱包络合成高频带语音;最后将高频带与原窄带信号之和作为最终的宽带信号.仿真及与其他方法比较说明,本文的方法所需计算量小,适合实时环境. 相似文献

12.

一种基于语音分类的清晰度客观评价算法

下载免费PDF全文

张雄伟沈刘平曹铁勇杨吉斌孙新建《解放军理工大学学报(自然科学版)》2007,8(2):103-107

为了能方便、快捷、可靠地对失真语音进行语音清晰度性能评价,提出了一种基于语音分类的加权巴克谱失真语音清晰度客观评价算法SC-WBSD.该算法提出在巴克域中对清音帧、浊音帧及过渡音帧巴克带谱失真进行加权来求失真语音的客观失真测度.通过分析 3类语音的巴克谱失真测度与DRT分的相关程度,提出一组以相关系数的幂次方为权重的有效SC-WBSD权重矢量.实验结果表明,SC-WBSD方法和DRT分的相关度达到了0.924 73,与巴克谱失真测度算法相比提高了4%. 相似文献

13.

基于分类识别的隐马尔可夫模型语音识别技术

魏明哲《山西师范大学学报：自然科学版》2014,(3):26-29

通过分析基于隐马尔可夫模型(HMM)语音识别的原理,针对模板提取过程中语音信号的基音频率差别增大而出现的语音识别率下降的问题,提出分类识别的方法,通过采用基音周期(Pitch)判决方法,将特征相近的帧合并,并计算基音频率的MEL频率倒谱系数,采用隐马尔可夫模型(HMM)进行语音识别,最终通过仿真实验验证分类识别方法对语音识别率提高的影响,得出此方法的适用环境和范围. 相似文献

14.

改进的频域基音检测算法

由红陈健《上海交通大学学报》2001,35(6):855-858

在语音信号的低码率参数编码算法中,准确地提取基音信息是一个重要环节,文中对基于正弦波语音模型的频域基音检测算法的运算量大、易受共振峰干扰等问题提出了改进,改进后算法的运算量小,算法的准确性高,有效地减小了共振峰对频域基音检测算法的影响,模拟实验表明,改进算法的运算量仅为原算法的13%。相似文献

15.

基于频域和时域结合的基音周期提取算法

徐敬德常亮崔慧娟唐昆《清华大学学报(自然科学版)》2012,(3):413-415,420

基音周期提取是语音编码和语音识别领域的一项重要研究课题。为了解决传统的自相关方法容易出现的半频倍频错误,提出了基于时域和频域分析的提取算法。该算法首先提取时域自相关值最大的若干个候选值;然后统计每个候选值对应的频域上所有相邻两个谐波能量和的最大值,用来对其自相关值进行加权;最后根据历史的基音周期值以及候选基音周期所对应的频域能量值对加权值进行修正。使用Keele数据库进行测试表明,使用该算法后基音周期提取的半频倍频错误率比传统算法下降了50%左右。相似文献

16.

采用Fisher分类法实现清浊音判决 总被引：5，自引：0，他引：5

周志杰胡光锐《上海交通大学学报》1997,31(5):30-32

采用Ｆｉｓｈｅｒ分类法实现清浊音判决，计算机模拟结果显示，该方法准确率达９７．４＾，优于传统的清浊音判决算法。相似文献

17.

一种汉语语音基音轨迹的平滑算法

陈立伟章东升宋宪晨杨洪利《应用科技》2007,34(9):41-45

基音是指人们发浊音时声带振动所引起的周期性,而声带振动频率的倒数就是基音周期.语音信号处理中精确提取特定语音的基音周期有重要的意义,基音周期的检测无论在语音信号的合成、编码还是识别方面,都起着非常重要的作用.该文依据数字语音信号的特点,设计了一种用于语音处理的层叠滤波算法,合理选择结构元素构筑了一组用于汉语语音基音轨迹平滑的层叠滤波器,仿真实验结果表明,这种方法对于随机误判点与传统的基于中值与线性平滑的组合平滑相比效果更佳,同时也证明了层叠滤波器用于语音信号研究的可行性. 相似文献

18.

基于小波变换的汉语三字词语音基音频率提取 总被引：2，自引：0，他引：2

王义元赵黎明《吉林大学学报(信息科学版)》2005,23(1):22-26

声调是基音频率的轮廓,为准确提取基音频率,进行具有汉语特色的连续语音识别,提出了具有汉语特色的清浊音切分方法.与常用的阈值法相比,该方法能更好地找到清浊音的切分点,尤其是在字与字连接紧密时更有效(在这种情况下阈值法往往失效).在此基础上,利用小波变换的多分辨分析特性进行了汉语三字词语音基音频率的提取.实验结果显示,该算法能有效地将三字词语音分开,且得到的基音频率曲线符合汉语三字词语音的声调模式. 相似文献

19.

一种特定人声道频率响应的精确的提取方法 总被引：2，自引：2，他引：0

卢侃和应民陈立伟《应用科技》2005,32(6):4-6

提出了一种在浊音中切取相当基音长度的一段波形,用傅里叶变换求出谱线,多次填充构造精确声道频率响应函数的新方法.经过实验,证实此方法特别适合特定人的语音识别,也能较好合成出模仿特定人的语音. 相似文献