首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
提出了一种能够提高ITU-TG.729算法性能的静音检测技术,该技术的引入不仅可以降低G.729的语音通讯平均传输出特率,而且可以大量节省G.729压缩和解压过程的实际运算量,通过在不同的噪声背景下的性能分析,该静音检测技术的引入不会对G.729算法的合成语音质量产生明显的影响。  相似文献   

2.
在G.729.1宽带语音编码算法中,时域混叠编码器的谱包络编码根据帧内子带的相关性,采用差分霍夫曼编码来减少编码的比特分配。针对相邻帧对应子带的谱包络存在相关性,给出了在原有谱包络编码模式的基础上,增加一种帧间对应子带差分霍夫曼编码的模式来进一步减少谱包络的编码比特数,从而提高合成语音的质量。由于G.729.1可以根据信道的特征随时调整编码速率以取得更好的宽带语音质量,这使得该编码算法具有很高的复杂度。为了能在数字信号处理器(digital signal processor,DSP)上实时实现G.729.1,结合TMS320VC5505数字信号处理器对G.729.1算法采用全汇编实现,并对汇编后的G.729.1代码做了进一步的汇编优化,优化后的G.729.1算法在保证了高质量语音输出的同时,提高了编码效率,实现了对语音信号的实时处理。  相似文献   

3.
基于变分辨率频谱特征的向量机静音检测和实时混音技术   总被引:1,自引:0,他引:1  
静音检测算法基于两个语音感觉特征与变分辨率频谱的Mel频率倒谱系数组合成音频特征,采用多门限过零率对静音进行初判,并通过二分类支持向量机对组合语音特征进行分类;实时混音算法使用每一路音频的短时能量作为混音权重.测试表明,静音检测算法在不同信噪比下语音识别正确率高于G.729B静音检测算法;实时混音算法听觉测试优于传统的算法,并且混音计算延时低,满足网络实时传输的要求;两种算法同时应用于视频会议系统,视频会议服务器的运算量低于使用了G.729B静音检测算法的视频系统.  相似文献   

4.
基于DSP的G.729语音编解码器的实时实现   总被引:2,自引:0,他引:2  
随着信息技术的发展,需要在有限的带宽下传送更多的数据,数据压缩技术日趋重要.国际电信联盟(ITU)推出的G.729协议是基于共扼结构——代数码激励线性预测的语音编解码算法.提出了基于TMS320VC5402的硬件实现方案,设计与实现了G.729语音采集与处理系统,并针对算法进行了软件优化,优化后的算法复杂度为48.5MIPS,达到了在目标系统上实时实现的目标.  相似文献   

5.
基于G.729A和AES的分组语音保密通信   总被引:1,自引:0,他引:1  
AES分组密码由多轮迭代的轮函数构成,对轮函数包括的4个面向字节的变换:字节变换、行移位、列混合和加载子密钥作简要介绍和分析;并简要描述了G.729A的编码、解码器的工作流程和参数结构.由于AES标准仅支持128bit的分组加密,而G.729A语音编码帧的大小为80bit,所以不能直接应用AES来加密G.729A的编码语音来实现语音保密通信,在不损害AES的安全强度下,提出两个适用于加密G.729A编码语音帧的AES修正方案:AES160和AES80,根据分组密码的随机性测试、明密独立性测试、雪崩效应测试分析AES160和AES80密码统计性能,测试结果表明AES160和AES80都有优秀的密码学统计性能,最后利用随机误码,分析基于G.729A和AES的语音保密通信系统的抗误码性能,结果表明AES160和AES80适用于加密G.729A的语音编码帧,并保留了AES的密码安全性能。  相似文献   

6.
基于G.729A语音实时传输系统的实现   总被引:1,自引:0,他引:1  
简述G.729A编码和解码的原理,以及编码器和解码器的简化流程。语音实时传输系统由录音压缩、网络通信和解压播放3个模块组成,实现G.729A编码器与解码器的封装、语音录制与播放、流式套接字和线性同步等功能。系统测试结果表明,基于G.729A语音实时传输系统具有较好的语音通信效果。  相似文献   

7.
G.729标准在个人移动通信、多媒体通信、IP电话、卫星通信及综合业务数字通信(ISDN)等领域具有广泛的应用前景。本文详细分析了G.729算法的C语言源代码,并详细研究了G.729算法在VC 6.0平台上的实现方法和过程,给出了实现结果,并根据实现结果利用MATLAB分析了G.729算法的特点。  相似文献   

8.
针对VoIP系统普遍使用G.729a语音编码,采用逐帧按位取反的方式对G.729a语音进行全面测试,以客观的语音质量感知评价(PESQ)标准为依据,总结G.729a语音帧中可隐藏位(最低有效位).结合矩阵编码算法,提出一种基于G.729a语音的信息隐藏方法,以大量的语音样本为载体,对该方法进行测试分析.实验结果表明:该方法能提供可观的隐藏容量(8 bit·帧-1),较高的嵌入效率(2.678),很好的不可感知性(平均PESQ值为3.593),且很好地符合了VoIP通信的实时性要求.  相似文献   

9.
G729语音编解码实现方案的研究及基于DSP的实现   总被引:2,自引:0,他引:2  
语音压缩是现代多媒体通信中实现低速率语音通信的关键技术.其中ITU-T G729协议是基于共扼结构-代数码激励线性预测( CS-ACELP)的语音压缩编码技术.本文首先对CS-ACELP算法所采用的主要技术进行了介绍,对G729协议的算法结构及其原理进行了分析,并提出了基于DSP的G729语音编码和语音、解码实现方案,探讨了此算法实现的代码优化方法.  相似文献   

10.
《应用科技》2009,36(5):76-76
TD-SSCDMA是由中国无线通信标准研究组提交并被国际电信联盟(ITU)批准的第三代移动通信(3G)国际主流标准,是我国百年电信史上第一个被国际电信联盟接受的全球移动通信标准。  相似文献   

11.
文章涉及了语音编码中最新的一种编码方式——变速率语音编码。语音激活检测 (VAD)算法是其中的关键部分 ,直接影响语音质量和试听效果。文章通过分析国际电信联盟的 G.72 9B标准 ,提出了一种适用于三速率语音编码方式的VA D算法。该算法结合了声学分类 ,对噪声、清音和浊音加以区分 ,最后给出了仿真结果 ,证明其稳健性和有效性  相似文献   

12.
语音端点检测(voice activity detection,VAD)是在连续语音信号中,将语音和非语言片段分离的技术。VAD在语音识别、说话人识别、语音编码等领域起着重要作用。传统VAD算法在类型已知的噪声环境下可以达到较好的性能,但在实际情况中,未知噪声的影响通常会使系统性能下降显著,在差异化噪声下的VAD是端点检测的研究难点。在总结现有语音端点检测算法基础上,提出了一种基于深度神经网络的语音端点检测方法,同时结合维特比算法,与基于贝叶斯信息准则(bayesian information criterion, BIC)的混合高斯模型(gaussian mixture model,GMM) 语音端点检测系统进行对比,在大词汇连续语音识别系统中的实验结果表明,将深度神经网络结合维特比算法,应用于语音端点检测,在复杂噪声环境下取得了更好的效果,适应性更强。  相似文献   

13.
低信噪比下基于谱熵的语音端点检测算法   总被引:14,自引:0,他引:14  
为提高语音端点检测系统在低信噪(0 dB以下)下检测的准确率,提出了一种基于谱熵的端点检测算法。将每帧信号分为16个子带,选取频谱分布在250~3.5 kH z并且能量不超过该帧总能量90%的子带,计算经过语音增强后的子带能量以及各子带信噪比,根据各子带信噪比的不同调整其在整个谱熵计算过程中的权重,然后平滑谱熵,以最终的谱熵作为端点检测的依据。实验结果表明,此方法在较低的信噪比下能够显著地提高端点检测的准确率。对坦克噪声,检测效果明显优于G.729中的端点检测算法,即使在-5 dB的信噪比下,仍然可以达到95%以上的检测率。  相似文献   

14.
详细分析了3种常用语音编码方案的LSP参数,描述了不同的语音编码之间进行码流转换时常见的LSP参数转换问题,提出一种LSP参数的平滑内插转换方案,在一定程度上改善了转换后的语音质量,较传统的Tandem Transcoding编码转换方案节省了>10%的计算量.  相似文献   

15.
在语音信号处理系统中,基于帧能量的语音端点检测(voiceactivitydetection,VAD)往往受到语音段能量不平稳及噪声的影响,为了提高语音端点检测的性能和鲁棒性,引入视觉信息。该文提出采用基于数据驱动的线性变换生成视觉特征,在提出一个基于统计的VAD一般模型的基础上构建两个单模式的VAD系统,通过两步式的融合方法,得到了多模式的VAD系统。实验表明:同时利用音频和视觉信息的多模式VAD比基于帧能量的听觉VAD在帧错误率上有55.0%的相对下降,在断句错误率上有98.5%的相对下降。这一结果说明多模式VAD方法基本可以避免断句错误,也能够显著改善帧检测性能,是一种相当有效的方法。  相似文献   

16.
一种高质量语音编解码专用芯片的设计   总被引:2,自引:0,他引:2  
为满足中速率高质量语音通信系统的需要 ,采用数字信号处理器内核 (DSP Core)的方法 ,设计了具有国际电信联盟 (ITU )建议 G.72 9A语音编解码器、自适应回声抵消和单路同步功能的专用芯片。根据所用数字信号处理器内核的特点 ,对 G.72 9A算法进行了优化 ,降低了算法复杂度和所需存储空间 ,实现了 G.72 9A全部功能 ,并通过了全部ITU测试序列的检验。回声抵消部分使用归一化最小二乘(NL MS)自适应滤波器实现 ,并设计了近端语音活动性检测和非线性残余回声抑制等功能模块 ,使其性能完全符合 ITU建议 G.16 5各项指标要求。在单路同步模块中 ,使用了并行模二比特排除方法 ,具有同步扑捉快、抗信道误码能力强的优点。专用芯片使用较少的资源 ,在一块芯片上集成了以上全部功能  相似文献   

17.
AMR与G.729之间的转码算法   总被引:1,自引:1,他引:0  
提出了AMR与G.729语音编码标准之间的2种新型转码算法--索引域转码算法和语音域转码算法.它们分别针对具有相同和不同固定码本结构的语音编码标准进行转码.索引域转码算法直接对2个编码的索引值进行相互转换;语音域转码算法则需要在语音域重新对转换的固定码本及增益进行搜索.实验结果表明,这2种转码算法都能有效地降低转码复杂度,语音域转码算法的算法复杂度仅为传统Tandem转码的55%左右,而索引域转码算法的算法复杂度则不到Tandem转码的10%.同时,索引域转码算法的语音质量相对Tandem转码有所提高,而语音域转码算法则保持了约略相当的语音质量.  相似文献   

18.
在分组网络中传输语音时,因为存在流量过载的情况,所以需要考虑其引发的分组丢失对生成语音质量的影响,对于采用合成分析法的语音编码方式,一旦分组丢失,会引起译码器输出语音的质量明显降低,介绍了一种于基共轭代数码本激励线性预测编译码器丢失语音帧的重建机制,依照G.729标准的三种兼容程度分别建立模型,重点在于外推出激励信号和综合滤波器参数。运用本机制模拟随机性和突发性的帧丢失两种情况,发现在帧丢失率达3  相似文献   

19.
根据语音信号偏离高斯分布程度大而背景噪声信号偏离高斯分布程度小这一特征,提出一种改进的以语音短时幅度谱偏度为特征参数区分语音段和噪声段的语音激活检测算法,并应用到2.4 kbit/s混合激励线性预测(mixed excitation linear prediction,MELP)声码器中.通过与自适应多速率(adaptive multi-rate,AMR)语音编码标准中的语音激活检测算法相比较,该算法复杂度较小,且对背景噪声服从高斯分布的语音信号具有更好的端点检测性能.实现了可变速率MELP声码器的平均输出码率下降为1.9 kbit/s,通过非连续传输后合成的语音具有良好的舒适性和连续性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号