首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
基于Haar小波提升的2.4kbit/s CWI语音编码算法   总被引:1,自引:0,他引:1  
提出一种基于Haar小波提升的2.4 kbit/s特征波形内插(CWI)语音编码算法.将特征波离散时间傅里叶级数(DTFS)得到的幅度谱转化为离散余弦变换(DCT)系数,用Haar小波提升实现特征波的多级分解与重建.利用相位谱间距的均值和基音周期增益联合判断浊音度标志,用于进行相位选择和离散余弦变换系数的选择性量化.主观A-B听音实验表明,该语音编码算法音质优于传统的3.8 kbit/s CWI编码器,在较低码率上获得较为满意的合成音质,且Haar小波提升特征波形分解与重建方法解决了传统小波变换CWI算法延时较大的问题.  相似文献   

2.
考察了特征波形内插(CWI)算法对于宽带语音编码的扩展能力.分析宽带特征波序列的性质表明,直接使用传统的特征波形内插算法并不适于增强宽带语音的编码效率及对计算复杂度的兼顾,可引入频带扩展(BWE)技术单独处理高频段.宽带语音的高、低频分别由特征波形内插编码和频带扩展算法恢复,由此形成了5.15 kbit/s的低速率宽带语音编码器,增强了语音真实感、辅音的辨析度及对话者的识别度,宽带语音编码质量接近AMR-WB的6.6 kbit/s结果.  相似文献   

3.
根据语音信号偏离高斯分布程度大而背景噪声信号偏离高斯分布程度小这一特征,提出一种改进的以语音短时幅度谱偏度为特征参数区分语音段和噪声段的语音激活检测算法,并应用到2.4 kbit/s混合激励线性预测(mixed excitation linear prediction,MELP)声码器中.通过与自适应多速率(adaptive multi-rate,AMR)语音编码标准中的语音激活检测算法相比较,该算法复杂度较小,且对背景噪声服从高斯分布的语音信号具有更好的端点检测性能.实现了可变速率MELP声码器的平均输出码率下降为1.9 kbit/s,通过非连续传输后合成的语音具有良好的舒适性和连续性.  相似文献   

4.
针对非负矩阵分解算法实现语音增强效果不理想的问题,提出了一种双重约束非负矩阵分解结合改进正交匹配追踪算法的语音增强方法.采用时间约束及稀疏度约束的双重约束方式改进非负矩阵分解算法,使得分解后的数据更能反映出语音特征.通过改进正交匹配追踪算法提升重构精度,并结合语音信号在时频域的分布特征,引入低通滤波器进一步平滑重构后的...  相似文献   

5.
基于小波变换提出可分级变速率特征波形内插(CWI)语音编码算法.利用二次B样条双正交小波变换将二维特征波表面分解成不同的时频分辨率空间,将其作为可分级CWI编码方案的增强层,而基本层仅包含线性预测参数、基音周期和功率归一化因子,使CWI编码的输出码流获得可分级变速率的效果.MUSHRA主观听音比较测试表明,随着码率由1.8 kbit/s增加到3.6 kbit/s,基于小波变换的可分级变速率CWI编码器基本层输出可接受的音质,增强层依次使编码音质得到提高.  相似文献   

6.
为了提高通信系统的抗干扰和抗攻击能力,尽可能降低语音编码速率.提出了一种O.6 kb/s语音编码算法.算法基于3帧联合,对多帧联合参数采用高效矢量量化,在降低语音编码速率的条件下保证语音编码质量.其中,对线谱对参数采用预测多模式多级矢量量化码本结构.在码本设计过程中,提出了多模式渐进闭环设计,对各类码本联合优化,并联合优化预测器和量化器,可以有效提高线谱对参数量化质量.在译码方,采用多带混和谐波激励提高合成语音清晰度.测试结果表明,该语音编码算法合成语音PESQ(perceptualevaluation of speech quality)得分可以达到2.7,汉语诊断押韵测试DRT(diagnostic rhyme test)得分可以达到89.7.  相似文献   

7.
高质量的0.6 kb/s声码器算法   总被引:13,自引:2,他引:13  
为满足语音信息存贮和交流对极低速率下语音压缩编码的需求,提出了一种0.6 kb/s声码器算法.此算法基于线性预测正弦激励模型,在极低码率下获得高质量的合成语音,提出清浊音定位和量化方法,应用了多帧参数联合矢量量化技术,以及多带正弦混合激励、谱增强等技术.主观听觉测试显示,在0.6 kb/s的速率下,此声码器合成语音不仅具有高可懂度而且具有一定的自然度,诊断押韵测试(DRT)的分数为89.5%, 而且在10-2的随机误码的信道条件下仍然具有很好的可懂度.实验表明 利用帧间参数相关性及矢量量化的方法可以将编码速率大幅度压低而保持较高清晰度.  相似文献   

8.
声码器是实现语音信号数字化存储和传输的关键部件,降低编码速率和提高话音质量是声码器研究的目标。目前,16kbit/s以上速率的声码器质量已达到长话质量,当前声码器的研究重点是8kbit/s以下高质量、低速率、短时延的多速率声码器,以满足多种应用场合的需要。一种采用CS-ACELP、ACELP、CELP、MELP、IMBE等多种先进的语音编码技术,集1.2、2.4、4.8、5.3、6.3、8kbit/s等速率于一体,符合G.729/G.729A/G.729B、G.723.1、美国FIPS等语音编码标准的多速率、多功能、高质量声码器最近由解放军理工大学通信工程学院研制成功。该声码器…  相似文献   

9.
为了解决传统的语音编码使用波形编码或者参数编码方法时存在的编码速率较高,语音合成的自然度不高等不足,研究了以码激励线性预测(CELP)为基础的混合编码方法;探讨了CELP的算法原理及其关键技术,特别是对其中的码本搜索算法进行了改进,减小了算法的复杂度,提高了运行速度,并在TI公司的TMS320VC5410开发套件上得到了实时实现.实验结果表明,该算法在编码速率为8kbit/s时有较好的语音回放效果.  相似文献   

10.
基于图正则化非负矩阵分解算法(GNMF),提出一种基于凸光滑的L3/2范数正则化图非负矩阵分解算法.该算法用非负矩阵分解算法对数据进行低维非负分解时,根据流形学习的图框架理论,构建邻接矩阵保持数据局部几何结构,并对数据的低维表示特征进行凸光滑的L3/2范数稀疏性约束,在给出算法更新迭代规则的同时,从理论上证明了所给算法的收敛性.通过人脸数据库ORL、手写体数据库USPS和图像库COIL20的仿真实验表明,相对于非负矩阵分解算法及其基于稀疏表示的改进算法,所给算法均具有更高的聚类精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号