期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

计哲高圣翔唐昆金鑫《清华大学学报(自然科学版)》2013,(6):869-872

在低速率语音编码算法中,如何对特征参数进行有效的量化表示是影响声码器合成语音质量的关键因素。该文提出一种能量参数解码端恢复算法,它利用线谱频率(linespectral frequency,LSF)和清浊音判决参数(unvoiced/voiced decision,U/V)估计能量参数的变化轨迹。该算法利用特征参数之间的相关性,采用隐Markov模型(hiddenMarkov model,HMM)描述LSF、U/V和能量参数之间的统计特性,通过对能量进行解码端恢复,省去量化所需的比特数,从而提高特征参数的整体量化性能。测试结果表明:能量参数解码端恢复算法能够将150b/s混合激励线性预测编码算法(mixed excitation linear prediction,MELP)的合成语音平均意见得分(mean opinion score,MOS)提高0.042。该算法应用于超低速率声码器参数量化是可行的。相似文献

2.

SELP 2.4kb/s语音编码算法跳跃帧判决及处理

计哲李晔崔慧娟唐昆《清华大学学报(自然科学版)网络.预览》2009,(8)

为解决正弦激励线性预测(SELP)2.4kb/s语音编码算法中清浊音过渡时合成语音的质量较差的问题,该文利用子带清浊音判决参数量化过程中存在的冗余度,提出了一种跳跃帧判决及处理方法。该方法根据当前帧前后各60个样点的平均能量比值判定当前帧是否为跳跃帧,并利用子带清浊音判决参数量化的冗余度传送跳跃帧信息。解码端根据当前帧是否为跳跃帧对解码端参数采用不同的插值方案。测试结果表明,该方法能够将合成语音的MOS分提高0.004左右。相似文献

3.

基于码本共享算法的分模式多级矢量量化

魏旋计哲崔慧娟唐昆《清华大学学报(自然科学版)》2011,(1):131-134

为了在存储量受限的情况下尽可能提高线性预测编码(linear predictive coding,LPC)系数量化性能,提出了一种基于码本共享算法的分模式多级矢量量化(multi-stagevector quantization,MSVQ)算法。由于LPC参数的分布与清浊音(unvoiced/voiced,U/V)参数相关,该算法对不同U/V对应的LPC参数进行不同量化,然后利用码本共享算法减少存储量需求。实验表明:在相同码率的情况下,该算法较MSVQ平均谱失真(spectrum distortion,SD)降低3.2%,码本大小增加26.7%;较分模式量化(mode-basedquantization,MBQ)平均谱失真升高3.6%,但是码本尺寸下降了92.1%。该算法是MSVQ与MBQ算法的一种折衷,在增加少量存储量的情况下提高了LPC系数的量化性能。相似文献

4.

基于码字特征的多模式多级矢量量化算法 总被引：1，自引：0，他引：1

徐敬德常亮计哲崔慧娟唐昆《清华大学学报(自然科学版)》2011,(2)

为提高声码器中线谱频率参数多级矢量量化的性能,提出了一种根据码字特征进行分模式量化的算法。该算法首先根据下一级量化误差最小化的准则,通过训练得到本级代表模式信息的码字(码字数目为模式数目);然后统计与各个码字相对应的输入矢量占总矢量的比重,继而得到各模式码字所分化的码字个数;最后根据该分化方案训练得到本级所有码字并确定码字与模式的对应关系,从而进行分模式量化。测试结果表明:相比于根据本级码字索引平均进行模式分配的简单方案,该算法可以使平均谱失真(ASD)降低0.05 dB,而平均意见得分(MOS)提高0.02左右。相似文献

5.

面向维吾尔语电话交谈式语音识别的词典设计方法研究

李鑫侯炜计哲《重庆邮电大学学报(自然科学版)》2013,25(3):391-396

为了解决基于词语的维吾尔语语音识别系统集外词过多的问题,采用形态分析生成的语素或数据驱动切分生成的统计子词代替词语作为识别系统的词典单元。在此基础上,提出一种根据语素识别系统和统计子词识别系统在声学模型训练数据上的音素错误率差别选择词语最佳分解结果,从而构建语素-统计子词联合词典的方法。在维吾尔语电话交谈式语音识别任务上比较各个系统的性能。实验结果表明,语素或统计子词的运用能有效缓解词语系统集外词过多的问题。与词典大小为200K的词语系统相比,55K的语素-统计子词联合系统使测试集上的音素错误率从45.4%下降到43.8%。相似文献

6.

带有帧间级间预测的线谱频率参数多级矢量量化 总被引：2，自引：1，他引：1

李晔彭坦许明计哲崔慧娟唐昆《清华大学学报(自然科学版)》2009,(7)

为在极低速率下实现高质量的语音编码,提出一种高效的带有帧间及级间预测的线谱频率参数多级码本矢量量化(IFP-MSVQ-ISP)算法。算法利用多级矢量量化中上一级码本的选定码矢对残差矢量进行预测,对去除预测分量的残差矢量再进行下一级矢量量化。测试结果表明,这种带有多级码本级间预测的算法与无级间预测的算法相比,能够有效降低线谱频率参数的量化误差,使谱失真降低0.1 dB以上,合成语音客观MOS提高0.02以上。该算法的实现对极低速率下语音压缩编码算法的研究具有重要的参考价值。相似文献

7.

基于Gauss混合模型的清浊音恢复改进算法

计哲徐敬德常亮崔慧娟唐昆《清华大学学报(自然科学版)》2011,(11):1661-1665

为提高子带清浊音(unvoiced/voiced,U/V)解码端恢复算法在不同能量电平下的鲁棒性,提出了一种改进型能量自适应U/V参数解码端恢复算法。通过跟踪长时能量的变化轨迹,在Gauss混合模型(Gaussian mixed model,GMM)下,用归一化的能量参数和线谱频率参数(line spec-tral frequency,LSF)对U/V参数的分布特性进行估计。测试结果表明:在较低的能量电平下,与用绝对能量对U/V参数进行恢复的算法相比,该能量自适应U/V参数恢复算法能够将清浊音误判率降低10%～25%,并将合成语音的平均意见得分(mean opinion score,MOS)提高0.03～0.09,改善了算法的性能。相似文献

8.

SELP 2.4kb/s语音编码算法跳跃帧判决及处理

计哲李晔崔慧娟唐昆《清华大学学报(自然科学版)》2009,(8)

为解决正弦激励线性预测(SELP)2.4 kb/s语音编码算法中清浊音过渡时合成语音的质量较差的问题,该文利用子带清浊音判决参数量化过程中存在的冗余度,提出了一种跳跃帧判决及处理方法。该方法根据当前帧前后各60个样点的平均能量比值判定当前帧是否为跳跃帧,并利用子带清浊音判决参数量化的冗余度传送跳跃帧信息。解码端根据当前帧是否为跳跃帧对解码端参数采用不同的插值方案。测试结果表明,该方法能够将合成语音的M O S分提高0.004左右。相似文献

9.

带有帧间级间预测的线谱频率参数多级矢量量化技术 总被引：1，自引：0，他引：1

李晔彭坦许明计哲崔慧娟唐昆《清华大学学报(自然科学版)网络.预览》2009,(7)

为在极低速率下实现高质量的语音编码,提出一种高效的带有帧间及级间预测的线谱频率参数多级码本矢量量化(IFP-MSVQ-ISP)算法。算法利用多级矢量量化中上一级码本的选定码矢对残差矢量进行预测,对去除预测分量的残差矢量再进行下一级矢量量化。测试结果表明,这种带有多级码本级间预测的算法与无级间预测的算法相比,能够有效降低线谱频率参数的量化误差,使谱失真降低0.1dB以上,合成语音客观MOS提高0.02以上。该算法的实现对极低速率下语音压缩编码算法的研究具有极其重要的意义。相似文献