首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 281 毫秒
1.
为降低码书的存储空间和搜索复杂度,更充分地利用线谱频率参数帧内和帧间的相关性,提出了一种快速、低存储的矢量量化器。将线谱频率参数去除平均值后进行一阶滑动平均预测,将残差进行三级矢量量化。在第二级量化时,将高维线谱频率参数矢量分裂成两个低维的部分,分别用不同的码书进行量化,降低了码书的存储空间和搜索复杂度。C语言仿真结果显示,在满足低速率编码的前提下,平均谱失真达到0.91 dB,2~4 dB的谱泄露为0.13%,无4 dB以上谱泄露,同时码书的存储空间和搜索复杂度均降低了31%以上。  相似文献   

2.
矢量量化可有效降低语音编码速率,但目前已有的多级分裂矢量量化、转换分类分裂矢量量化方法等都存在存储需求、计算复杂度以及解码语音质量等不能达到良好折衷的缺陷。该文提出了一种码书分类重排矢量量化方法。该方法通过将设计好的码书进行分类重排以降低码书搜索范围。并将该方法与多级分裂矢量量化结合,提出了码书分类重排多级分裂矢量量化方法。在量化比特及码书大小不变的前提下,实验结果表明:该方法可达到透明量化效果,量化时的计算复杂度最大降幅可达到多级分裂矢量量化方法的90.24%。  相似文献   

3.
在混合激励线性预测 (mixed excitation linear prediction, MELP) 模型的基础上,以超帧为单位,采用多帧联合编码技术,分模式对子帧的语音特征参数进行联合量化,实现了一种码率为600 bit/s的声码器。为了进一步减小量化误差,设计出了一种基于高斯混合模型的预测分类分裂矢量量化器(predictive switched split vector quantization based on Gauss mixture model, GMM-PSSVQ),该量化器对超帧中某些子帧的线谱频率进行量化,并利用帧间预测和线性插值等方法提高编码效率。采用谱失真对设计的矢量量化器进行性能评估,并分别与多级矢量量化和预测分裂矢量量化算法进行性能比较;通过客观感知语音质量评估和主观判断韵字测试对实现的声码器进行性能测试。测试结果表明,设计的矢量量化器平均谱失真最低,实现的声码器合成语音具有较高的清晰度和可懂度。  相似文献   

4.
带有帧间级间预测的线谱频率参数多级矢量量化   总被引:2,自引:1,他引:1  
为在极低速率下实现高质量的语音编码,提出一种高效的带有帧间及级间预测的线谱频率参数多级码本矢量量化(IFP-MSVQ-ISP)算法。算法利用多级矢量量化中上一级码本的选定码矢对残差矢量进行预测,对去除预测分量的残差矢量再进行下一级矢量量化。测试结果表明,这种带有多级码本级间预测的算法与无级间预测的算法相比,能够有效降低线谱频率参数的量化误差,使谱失真降低0.1 dB以上,合成语音客观MOS提高0.02以上。该算法的实现对极低速率下语音压缩编码算法的研究具有重要的参考价值。  相似文献   

5.
带有帧间级间预测的线谱频率参数多级矢量量化技术   总被引:1,自引:0,他引:1  
为在极低速率下实现高质量的语音编码,提出一种高效的带有帧间及级间预测的线谱频率参数多级码本矢量量化(IFP-MSVQ-ISP)算法。算法利用多级矢量量化中上一级码本的选定码矢对残差矢量进行预测,对去除预测分量的残差矢量再进行下一级矢量量化。测试结果表明,这种带有多级码本级间预测的算法与无级间预测的算法相比,能够有效降低线谱频率参数的量化误差,使谱失真降低0.1dB以上,合成语音客观MOS提高0.02以上。该算法的实现对极低速率下语音压缩编码算法的研究具有极其重要的意义。  相似文献   

6.
为降低谱包络参数的量化失真,研究了谱包络参数的平滑算法,称为DCT-S算法.谱包络参数用线谱频率(LSF)参数表示,用离散余弦变换(DCT)对多帧线谱频率(LSF)参数每一维组成的矢量进行变换,然后对DCT系数进行截断,再进行反离散余弦变换,得到LSF参数的平滑轨迹.测试表明,应用DCT-S算法,在LSF参数单帧矢量量化时,平均谱失真下降了约 0.23 dB;在LSF参数多帧联合矢量量化时,平均谱失真下降了约0.25~0.45 dB. 实验结果表明,DCT-S算法使谱包络参数的变化轨迹得到了平滑,有效地降低了谱失真.  相似文献   

7.
AMR—WB是一种高品质的宽带语音编码技术,其矢量量化时一般采用全搜索算法,该算法虽然精度比较高,但却存在计算复杂度高、搜索速度慢的问题.针对以上问题,提出了一种改进的矢量量化码字搜索算法.该算法引入了部分失真搜素算法,并对其初始匹配码字的设置进行了优化.仿真结果表明,改进后的算法在保证语音质量的前提下,提高了码书搜索的速度,从而改善了AMR.WB编码的效率.  相似文献   

8.
利用语音短时谱变化相对较慢、其邻近LSP(LineSpectrumPair)失量存在充分相关这一特性,提出了一种新的谱编码方法,即LSP编码的一步插值预测矢量量化。本文设计了一个18bit/frame分裂矢量量化方案用于量化预测残差,当帧变化周期为30ms时,平均谱失真仅为1.178dB。  相似文献   

9.
为了解决语音参数编码算法中多级矢量量化中码本尺寸过大,存储量过大,导致搜索复杂度大的问题,提出了多级矢量量化中的码本共享的迭代算法。该算法基于多级矢量量化中各级待量化码矢之间的相似性,采用模拟退火算法,通过迭代得出共享变换系数。在1.2 kb/s的正弦激励线性预测声码器中,采用该算法对线谱对参数进行多级矢量量化。测试结果表明:在共享级别选择恰当时,可降低存储量20%,同时重建语音谱失真损失约为0.02 dB,可见该算法可以有效降低码本容量,同时对语音质量影响极小。  相似文献   

10.
针对传统的信源优化多级矢量量化抗误码性能较差的问题,提出了一种结合信源和信道的多级矢量量化码本联合优化算法。该算法将码本联合优化与非等重信道保护相结合,充分利用多级矢量量化中各级码字之间的相互作用关系和非等重信道保护的特性,对各级码字进行非等重误码率的迭代优化来降低整个系统失真。在低速率语音编码中线谱频率参数的仿真测试表明:与信道优化的多级矢量量化独立码本和非等重信道保护相结合的方案相比,在8%误码率信道下该算法线谱频率参数的平均谱失真降低了0.1dB;与等重误码率的码本联合优化方案相比,在各种误码率信道下该算法线谱频率参数的平均谱失真都有明显降低。  相似文献   

11.
考察了特征波形内插(CWI)算法对于宽带语音编码的扩展能力.分析宽带特征波序列的性质表明,直接使用传统的特征波形内插算法并不适于增强宽带语音的编码效率及对计算复杂度的兼顾,可引入频带扩展(BWE)技术单独处理高频段.宽带语音的高、低频分别由特征波形内插编码和频带扩展算法恢复,由此形成了5.15 kbit/s的低速率宽带语音编码器,增强了语音真实感、辅音的辨析度及对话者的识别度,宽带语音编码质量接近AMR-WB的6.6 kbit/s结果.  相似文献   

12.
在G.729.1宽带语音编码算法中,时域混叠编码器的谱包络编码根据帧内子带的相关性,采用差分霍夫曼编码来减少编码的比特分配。针对相邻帧对应子带的谱包络存在相关性,给出了在原有谱包络编码模式的基础上,增加一种帧间对应子带差分霍夫曼编码的模式来进一步减少谱包络的编码比特数,从而提高合成语音的质量。由于G.729.1可以根据信道的特征随时调整编码速率以取得更好的宽带语音质量,这使得该编码算法具有很高的复杂度。为了能在数字信号处理器(digital signal processor,DSP)上实时实现G.729.1,结合TMS320VC5505数字信号处理器对G.729.1算法采用全汇编实现,并对汇编后的G.729.1代码做了进一步的汇编优化,优化后的G.729.1算法在保证了高质量语音输出的同时,提高了编码效率,实现了对语音信号的实时处理。  相似文献   

13.
运用基于离散Teager能量算子的浊音端点检测技术,将浊音端点及其之后的若干帧作为丢帧补偿的增强保护帧.在研究窄带语音帧间独立编码算法iLBC的基础上,对G.722.2编码标准进行改造,使之能够对宽带输入语音进行类似的帧间独立编码,以增强其抗丢帧鲁棒性.针对不同的丢帧率,对不同数目的增强保护帧进行帧间独立编码,以编码速率的略微提高增强对丢帧的鲁棒性,因此本算法既有iLBC的鲁棒性,又有一般CELP编码的速率自适应性.实验结果表明,相对于G.722.2编码标准附件Ⅰ补偿方法,本算法可以提高丢帧补偿性能,在浊音端点丢失率较高的情况下的效果更好.  相似文献   

14.
在对最新的MPEG4中的音频编码中码激励线性预测CELP(code excited linear predicive)编码器分析和研究的基础上,根据其窄带语音编码器的参数模式,建立和实现了一个基于CELP的语音编码实验系统,将高效的CELP编码技术应用于文语转换TTS(text-to-speech)系统中语音数据库的压缩,效果是满意的。  相似文献   

15.
文章涉及了语音编码中最新的一种编码方式——变速率语音编码。语音激活检测 (VAD)算法是其中的关键部分 ,直接影响语音质量和试听效果。文章通过分析国际电信联盟的 G.72 9B标准 ,提出了一种适用于三速率语音编码方式的VA D算法。该算法结合了声学分类 ,对噪声、清音和浊音加以区分 ,最后给出了仿真结果 ,证明其稳健性和有效性  相似文献   

16.
随着移动通信系统的广泛应用,低速率语音编码也获得了极大的发展。本文研究了一种基于连续正弦波形(CSW—Continuous Sinusoidal Waveform)的低速率语音编码算法。该算法是一种改进的正弦谐波编码算法,鳊码速率达到2.4kb/s以下。本算法采用叠加一组正弦波的方法来合成语音,这些正弦波的频率是基音频率的整数倍。并采用内核ARM920T(mpu是Samsung公司的S3C241O)对语音编码信号进行处理。  相似文献   

17.
基于对语音信号的分析,借鉴频率分带技术和码激励线性预测编码中传输残差信号可提高合成语音鲁棒性的思想,建立了双带激励模型,同时对基音检测、矢量量化、语音合成等环节加以改进,提出了最高码率为2400bit/s,最低码率为80bit/s的变码率增强型双带激励LPC(Linear Predictive Coding)低速语音编码算法。仿真结果表明:该算法在有效降低平均码率的前提下能保证较高的合成语音质量。  相似文献   

18.
以时域基音同步叠加 (TD PSOLA)技术和一个全汉语单音节库为合成单元进行汉语语音合成 ,合成的语音清晰度和自然度很高 .但是这样的系统语音库太大 ,不利于在小型设备中实现 ,影响了语音合成的进一步应用 .本文针对此问题 ,在研究A律压缩的基础上 ,采用自适应量化和自适应预测的技术 ,以较少增加合成运算量复杂度为代价 ,对语音库的编码实现压缩 ,使压缩后的语音库减小了约一半 ,大大减小了所需的存储空间 .并且利用压缩后的语音库合成语音 ,基本上不影响合成后的语音质量 ,从而进一步扩展了语音合成的应用 .  相似文献   

19.
用神经网络建立非线性预测模型对语音信号进行处理,采用后向预测建模,不增加传输码率。采用一种改进的广义径向基函数网络(GERBF),利用正交最小二乘法训练速度快的优点,降低算法的复杂性。实验表明:基于GERBF预测器的语音编码系统在嵌入维数很少时亦能较好地去除语音信号相关性,其恢复语音质量优于CCITT,建议G.721中的ADPCM算法。  相似文献   

20.
针对码本激励线性预测编码(CELP),将小波变换运用于长时基音预测后的二次残差信号,提出了小波激励线性预测(WELP)技术,大大降低了语音编码的复杂度。在保持相同合成音质的情况下,可使码速率为6.6kbit/s的WELP的编码速度较之相应的CELP提高一倍。在此基础上,给出了用两片ADSP2181芯片实现的6.6kbit/sWELP语音编译码器的定点实时实现系统,并对该系统作了性能测试和语音质量评测,表明了该系统的良好特性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号