期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

计哲高圣翔唐昆金鑫《清华大学学报(自然科学版)》2013,(6):869-872

在低速率语音编码算法中,如何对特征参数进行有效的量化表示是影响声码器合成语音质量的关键因素。该文提出一种能量参数解码端恢复算法,它利用线谱频率(linespectral frequency,LSF)和清浊音判决参数(unvoiced/voiced decision,U/V)估计能量参数的变化轨迹。该算法利用特征参数之间的相关性,采用隐Markov模型(hiddenMarkov model,HMM)描述LSF、U/V和能量参数之间的统计特性,通过对能量进行解码端恢复,省去量化所需的比特数,从而提高特征参数的整体量化性能。测试结果表明:能量参数解码端恢复算法能够将150b/s混合激励线性预测编码算法(mixed excitation linear prediction,MELP)的合成语音平均意见得分(mean opinion score,MOS)提高0.042。该算法应用于超低速率声码器参数量化是可行的。相似文献

2.

基于Gauss混合模型的清浊音恢复改进算法

计哲徐敬德常亮崔慧娟唐昆《清华大学学报(自然科学版)》2011,(11):1661-1665

为提高子带清浊音(unvoiced/voiced,U/V)解码端恢复算法在不同能量电平下的鲁棒性,提出了一种改进型能量自适应U/V参数解码端恢复算法。通过跟踪长时能量的变化轨迹,在Gauss混合模型(Gaussian mixed model,GMM)下,用归一化的能量参数和线谱频率参数(line spec-tral frequency,LSF)对U/V参数的分布特性进行估计。测试结果表明:在较低的能量电平下,与用绝对能量对U/V参数进行恢复的算法相比,该能量自适应U/V参数恢复算法能够将清浊音误判率降低10%～25%,并将合成语音的平均意见得分(mean opinion score,MOS)提高0.03～0.09,改善了算法的性能。相似文献

3.

SELP 2.4kb/s语音编码算法跳跃帧判决及处理

计哲李晔崔慧娟唐昆《清华大学学报(自然科学版)》2009,(8)

为解决正弦激励线性预测(SELP)2.4 kb/s语音编码算法中清浊音过渡时合成语音的质量较差的问题,该文利用子带清浊音判决参数量化过程中存在的冗余度,提出了一种跳跃帧判决及处理方法。该方法根据当前帧前后各60个样点的平均能量比值判定当前帧是否为跳跃帧,并利用子带清浊音判决参数量化的冗余度传送跳跃帧信息。解码端根据当前帧是否为跳跃帧对解码端参数采用不同的插值方案。测试结果表明,该方法能够将合成语音的M O S分提高0.004左右。相似文献

4.

SELP 2.4kb/s语音编码算法跳跃帧判决及处理

计哲李晔崔慧娟唐昆《清华大学学报(自然科学版)网络.预览》2009,(8)

为解决正弦激励线性预测(SELP)2.4kb/s语音编码算法中清浊音过渡时合成语音的质量较差的问题,该文利用子带清浊音判决参数量化过程中存在的冗余度,提出了一种跳跃帧判决及处理方法。该方法根据当前帧前后各60个样点的平均能量比值判定当前帧是否为跳跃帧,并利用子带清浊音判决参数量化的冗余度传送跳跃帧信息。解码端根据当前帧是否为跳跃帧对解码端参数采用不同的插值方案。测试结果表明,该方法能够将合成语音的MOS分提高0.004左右。相似文献

5.

基于码本共享算法的分模式多级矢量量化

魏旋计哲崔慧娟唐昆《清华大学学报(自然科学版)》2011,(1):131-134

为了在存储量受限的情况下尽可能提高线性预测编码(linear predictive coding,LPC)系数量化性能,提出了一种基于码本共享算法的分模式多级矢量量化(multi-stagevector quantization,MSVQ)算法。由于LPC参数的分布与清浊音(unvoiced/voiced,U/V)参数相关,该算法对不同U/V对应的LPC参数进行不同量化,然后利用码本共享算法减少存储量需求。实验表明:在相同码率的情况下,该算法较MSVQ平均谱失真(spectrum distortion,SD)降低3.2%,码本大小增加26.7%;较分模式量化(mode-basedquantization,MBQ)平均谱失真升高3.6%,但是码本尺寸下降了92.1%。该算法是MSVQ与MBQ算法的一种折衷,在增加少量存储量的情况下提高了LPC系数的量化性能。相似文献

6.

一种基于混合MELP/CELP的4 kbit/s声码器 总被引：1，自引：0，他引：1

李强舒勤军谢虹恩明艳《重庆邮电大学学报(自然科学版)》2017,29(2):143-148

利用混合激励线性预测 (mixed excitation linear prediction,MELP)算法和码激励线性预测(code excitation linear prediction,CELP)算法的优点,提出了一种混合MELP/CELP语音编码模型.编码端对强浊音帧采用MELP编码,对弱浊音帧和清音帧进行CELP编码.MELP编码器采用相位对齐技术提取强浊音帧的相位参数,解决了合成语音与原始语音在时间上不同步的问题.对实现的4 kbit/s混合MELP/CELP声码器进行客观MOS(mean opinion score)值和主观DRT(diagnostic rhythm test)清晰度测试,结果表明,该声码器的合成语音具有较高的可懂度和清晰度. 相似文献

7.

语音模糊特征提取及码本训练算法

姜占才杨林《吉林大学学报(信息科学版)》2012,30(3):279-284

为克服低速率声码器因清浊音硬判决、粗判决而导致解码语音有帧过渡等不自然感的缺陷,在分析比较目前主流声码器编码算法中激励参数提取和量化算法的基础上,将模
糊数学中的隶属度概念引入语音子带清浊音描述。提出了五维的浊音隶属度矢量概念,用于精细描述语音丰富的激励信息;阐述了浊音隶属度矢量的提取算法;提出了矢量量化码本的模糊聚类与LBG级联训练算法（F-LBG：Fuzzy-LBG）;采用提取算法提取、建立了浊音隶属度码本的训练样本集,采用F-LBG训练了浊音隶属度码本;将提取算法和F-LBG法训练得到的浊音隶属度码本分别应用于正弦激励声码器、混合激励声码器和同态声码器的语音编、解码仿真。结果表明,用浊音隶属度矢量描述合成语音激励信号的算法,具有较高的准确性和较强的噪声鲁棒性。相似文献

8.

正弦激励线性预测声码器子带清浊音模糊判决 总被引：1，自引：0，他引：1

李晔洪侃王童崔慧娟唐昆《清华大学学报(自然科学版)》2008,48(7)

为了解决目前正弦激励线性预测声码器中各子带的清浊音硬判决使得语音帧间产生明显过渡感的问题,提出一种子带清浊音模糊判决算法,直接采用自相关函数对各子带的清浊音度进行描述,矢量量化后传输至解码端,用于激励信号的产生.测试结果表明: 采用子带清浊音模糊判决算法,能够消除语音帧间的过渡感,能够使各种速率正弦激励线性预测声码器的平均主观意见得分提高约0.05以上. 相似文献

9.

自适应抗噪的清/浊/静音判决算法

《燕山大学学报》2015,(2)

清/浊/静音判决(UVS)是语音压缩、合成以及识别中的一个重要参数。为了解决传统判决方法训练过程复杂,导致语音编码效率低的问题,给出一种无训练过程的判决方法。提取基于循环平均幅度差的特征参量,利用判决参数间的相关性,自适应调整阈值,实现清/浊/静音判决。该判决方法具有很好的抗噪声干扰能力,有效提高判决的准确率。测试结果表明:该算法简化了清/浊/静音判决的计算量,清音误判率降低了10%,浊音误判率保持在4%以内;将该算法应用于低速率语音编码方案MELP(mixed excitation linear prediction)0.6 kbps的清浊音判决中,解码后的合成语音质量优于原始MELP编码方案,PESQ分数提高0.3,具有较好的可懂度和自然度。相似文献

10.

基于二级矢量量化的LPC声码器算法

胡倩姜占才王琛《青海师范大学学报(自然科学版)》2014,(3):34-38

为了有效地减少语音编码的比特数、降低量化误差以及提高解码语音质量,提出了一种二级矢量量化的LPC声码器算法.该算法在模糊聚类与LBG级联的VQ算法的基础上,进一步采用二级矢量量化算法对特征参数矢量进行量化.特征参数为语音的两个特征值:基音周期与增益.第一级码本为矢量码本;第二级码本为误差码本.将该算法应用于LPC声码器中进行仿真实验,结果表明:该算法能有效地降低量化比特数并且减少了量化误差,从而使解码语音质量得到改善. 相似文献

11.

预测自适应Gauss混合模型线谱频率量化

赵永刚唐昆崔慧娟《清华大学学报(自然科学版)网络.预览》2007,(4)

为了实现高质量低速率语音编码,提出了高效线性预测Gauss混合模型(Gaussianmixturemodel,GMM)线谱频率参数量化算法(LP-GMM-LSFQA)。线谱频率(linearspectralfrequency,LSF)参数先去均值,经过一阶线性预测,得到残差信号,将残差用协方差矩阵为对角阵GMM量化算法进行量化。在此基础上,利用反量化后参数自适应更新GMM的加权系数和均值,进一步提出了预测自适应GMM-LSF量化算法(LP-AGMM-LSFQA)。实验表明LP-GMM-LSFQA在20b/帧时量化性能超过预测分裂矢量量化22b/帧时的量化性能,节约2b/帧;LP-AGMM-LSFQA量化性能优于LP-GMM-LSFQA。相似文献

12.

预测自适应Gauss混合模型线谱频率的量化

赵永刚唐昆崔慧娟《清华大学学报(自然科学版)》2007,47(4):530-533

为了实现高质量低速率的语音编码,提出了高效线性预测Gauss混合模型(Gaussian mixture model,GMM)线谱频率参数量化算法(LP-GMM-LSFQA)。线谱频率(linear spectral frequency,LSF)参数先去均值,经过一阶线性预测,得到残差信号,将残差用协方差矩阵为对角阵GMM量化算法进行量化。在此基础上,利用反量化后参数自适应更新GMM的加权系数和均值,进一步提出了预测自适应GMM-LSF量化算法(LP-AGMM-LSFQA)。实验表明:LP-GMM-LSFQA在20 b/帧时量化性能超过预测分裂矢量量化22 b/帧时的量化性能,节约2b/帧;LP-AGMM-LSFQA量化性能优于LP-GMM-LSFQA。相似文献

13.

2.4kb/sMELP算法设计

胡剑凌徐盛陈健《上海交通大学学报》2000,(5)

提出了一种新的工作于极低码率下的混合激励线性预测 (MEL P)声码器 .该声码器结合了线性预测编码(L PC)和多带激励编码算法的优点 ,对算法和量化方案重新进行了设计和改造 ,其主要特征包括改进的基音检测算法、混合的周期脉冲和随机噪声激励、有效的线性谱频率 (L SF)参数量化以及激励谱形状表示 .非正式主观测试表明 ,由采用本算法的一个 2 .4kb/ s编码器所重建的语音质量略优于美国联邦标准 4.8kb/ s码激励线性预测编码 (CEL P)所重建的语音质量相似文献

14.

一种基于信道软译码的差错隐藏算法

下载免费PDF全文

肖勇张雄伟邹霞谢贵武《解放军理工大学学报(自然科学版)》2009,10(2):113-117

为满足恶劣无线环境下低速率语音通信需要,针对混合激励线性预测(MELP)提出了一种基于信道软译码的差错隐藏算法.利用软译码所得对数似然概率比估计比特错误概率,提出了利用比特错误概率和信源残留冗余,基于最大后验概率(MAP)估计合成端语音清浊音模式.对不同的清浊音模式,选择不同的参数重构方案,浊音帧时,利用对数似然概率比基于最小均方误差(MMSE)准则进行参数重构;清音帧时,硬判决对数似然概率比,由硬判决结果通过映射直接重构参数,在信道编码为递归系统卷积码和并行级联卷积码情况下,采用PESQ测试了提出的差错隐藏算法误码条件下合成语音质量.测试结果表明,与近年来提出的针对MELP的差错隐藏算法相比,该算法具有更好的性能. 相似文献

15.

基于谐振结构的线性预测编码

胡剑凌徐盛《上海交通大学学报》2002,36(12):1770-1773

语音编码中一般用线性预测编码(LPC)建立信号的声道响应，如何提高LPC的预测增益并用尽可能少的比特数量化LPC参数将直接影响编码器的性能．文中提出了一种基于信号谐振结构的LPC技术(HLPC)，利用HLPC可使LPC谱与信号谐振峰具有最佳的拟合，同时可获得0．36dB的额外预测增益．设计了LPC参数的线性预测多层分裂码本矢量量化(LPMSVQ)方法．数值实验表明，利用LPMSVQ可在21bit／帧下获得透明的量化质量．相似文献

16.

SELP声码器参数抗差错恢复算法

《清华大学学报(自然科学版)》2010,(5)

针对低速率语音编码领域的正弦激励线性预测(SELP)声码器,提出了一种错误帧参数修复算法。对于信道编解码不能纠错的语音帧,算法根据信道解码后所指示的错误信息,结合解码端各参数平稳性的不同,采用参数替换方法分别进行修复。测试结果表明:采用该算法,在1%、3%、5%的随机信道误码下,声码器抗误码性能均有较大改善,特别是在5%的较高信道误码率下,合成语音平均意见得分提高了0.2以上。相似文献

17.

高质量的0.6 kb/s声码器算法 总被引：13，自引：2，他引：13

张建伟贺天宏李军林崔慧娟唐昆《清华大学学报(自然科学版)》2003,43(4):449-452

为满足语音信息存贮和交流对极低速率下语音压缩编码的需求,提出了一种0.6 kb/s声码器算法.此算法基于线性预测正弦激励模型,在极低码率下获得高质量的合成语音,提出清浊音定位和量化方法,应用了多帧参数联合矢量量化技术,以及多带正弦混合激励、谱增强等技术.主观听觉测试显示,在0.6 kb/s的速率下,此声码器合成语音不仅具有高可懂度而且具有一定的自然度,诊断押韵测试(DRT)的分数为89.5%, 而且在10-2的随机误码的信道条件下仍然具有很好的可懂度.实验表明利用帧间参数相关性及矢量量化的方法可以将编码速率大幅度压低而保持较高清晰度. 相似文献

18.

基于条件PDF的宽带ISF参数分裂矢量量化方法

陈立伟刘晴晴《应用科技》2011,38(3):24-28

宽带ISF参数的矢量量化是语音编码中的重要环节,其量化性能的高低对于解码端语音的质量有重要影响.针对宽带语音ISF参数矢量量化问题,提出了一种新的量化方法.该方法利用ISF参数帧间相关性,将相邻2帧ISF参数的条件PDF用高斯概率模型表示.与传统分裂矢量量化不同,该方法首先根据前一帧的量化结果对当前帧分类、选择合适的码书,然后对该帧在选定的码书中进行分裂矢量量化.实验表明,该算法在每帧编码比特数44时达到透明量化,且平均谱失真比利用传统分裂矢量量化时的谱失真小. 相似文献

19.

基于局部余弦变换的2.4 kb/s低比特率语音编码

董恩清汪一鸣李宏亮侯兴松刘贵忠《西安交通大学学报》2003,37(4):388-391

系统地设计了一个基于局部余弦变换的2.4kb/s低比特率的语音编码器，对局部余弦变换系数采用分维矢量量化方法进行量化，码书设计采用LGB算法。编码中的码书搜索采用树形状快速搜索算法。通过主观非正式听力测试和客观参数评价，从理解性和自然度两方面来看，用设计的2.4kb/s低比特率的编码方法编码的语音质量比FS1015（LPC－10e)编码标准编码的语音质量要好，而且具有较强的鲁棒性，适合于对各种环境中的语音进行编码。相似文献

20.

基于LPC分析的语音特征参数研究及其在说话人识别中的应用 总被引：1，自引：0，他引：1

张玲华郑宝玉杨震《南京邮电大学学报(自然科学版)》2005,25(6):1-6

对LPC(线性预测系数)参数及其派生参数进行了研究,重点讨论了各参数的计算方法,在此基础上提出了一种由LPC参数和语音帧能量构成的组合参数。利用GMM对20个说话人进行了闭集文本无关说话人识别实验。结果表明,与LPC参数的派生参数相比,该组合参数可以以较少的运算量取得与LPC派生参数相当的识别效果;与直接使用LPC参数相比,该组合参数能够在运算量增加不明显的情况下改进系统的性能,特别是在测试音长度较短的情况下,对性能的改进尤为明显。相似文献