排序方式: 共有117条查询结果,搜索用时 15 毫秒
1.
针对在弱语音信号和低输入信噪比(SNR)情况下,基于短时谱估计的语音增强算法性能下降的问题,提出了一种结合软判决信息和人耳听觉掩蔽效应的短时谱估计算法。该算法在最小均方误差准则下引入语音存在的概率,得到软判决修正的增益函数,然后利用掩蔽门限不断地调整增益函数,进而调整噪声的抑制程度,保护微弱的语音信号,减少语音谱的失真。客观测试和主观试听表明,该算法在信噪比增益以及语音的可懂度、自然度方面都优于传统的最小均方误差估计算法。 相似文献
2.
基于参数模型的自适应二进制算术编码算法 总被引:1,自引:0,他引:1
为了在视频编码系统中更灵活地运用二进制算术编码,分析了内容自适应二进制算术编码算法的原理和编码流程,针对编码中的模型参数提出了2种不同的参数模型配置:高编码效率参数模型和低复杂度参数模型。低复杂度参数模型与高编码效率参数模型相比,在同等编码质量下可以将运算量降低约30%,存储空间节省87.5%,并结合视频编码中的码率控制机制提出了编码过程中在两种参数模型之间的自适应切换策略,以此来实现熵编码中复杂度和编码效率的折中,以适应不同的应用需求。 相似文献
3.
H.264视频编码中的快速失真与速率估计算法 总被引:1,自引:0,他引:1
H.264视频编码标准采用率失真优化技术追求更高的编码效率。针对每一个宏块,编码器需要遍历多种帧内和帧间模式,复杂度较大,提出了模式选择中速率和失真的快速估计算法。该算法省去了模式判决中的反变换和熵编码过程,利用频域系数来直接估计宏块的编码失真和速率,且失真的估计能适于不同的宏块类型,速率的估计能自适应于视频的内容。仿真结果表明,对于多种类型的视频序列,该算法相对于参考算法能够提供较高的估计准确度,在保持编码率失真性能下降不多的条件下,节省了约35%的模式决定时间。 相似文献
4.
基于结构相似度信息(SSIM)的图像质量评价方法结构简单、评价性能优于峰值信噪比(PSNR),但是在研究中发现SSIM不能很好地评价严重模糊的图像。该文提出一种基于频域的结构相似度(FSSIM)的图像质量评价方法。该方法将频域信息作为图像的主要结构信息,根据人眼视觉系统(HVS)对不同频率分量的敏感程度不同,对离散余弦变换后的各频率分量加权后得到图像的频域函数。由频域函数、亮度函数和对比度函数计算得到结构相似度。实验结果表明,FSSIM比SSIM和PSNR更符合人眼视觉系统特性,能较好的评价图像质量。 相似文献
5.
H.264视频编码标准采用率失真优化技术追求更高的编码效率。针对每一个宏块,编码器需要遍历多种帧内和帧间模式、复杂度较大;提出了模式选择中速率和失真的快速估计算法,该算法省去了模式判决中的反变换和熵编码过程,利用频域系数来直接估计宏块的编码失真和速率,且失真的估计能适于不同的宏块类型,速率的估计能自适应于视频的内容。仿真结果表明,对于多种类型的视频序列,该算法相对于参考算法能够提供较高的估计准确度,在保持编码率失真性能下降不多的条件下,节省了约35%的模式决定时间。 相似文献
6.
为解决正弦激励线性预测(SELP)2.4kb/s语音编码算法中清浊音过渡时合成语音的质量较差的问题,该文利用子带清浊音判决参数量化过程中存在的冗余度,提出了一种跳跃帧判决及处理方法。该方法根据当前帧前后各60个样点的平均能量比值判定当前帧是否为跳跃帧,并利用子带清浊音判决参数量化的冗余度传送跳跃帧信息。解码端根据当前帧是否为跳跃帧对解码端参数采用不同的插值方案。测试结果表明,该方法能够将合成语音的MOS分提高0.004左右。 相似文献
7.
针对视频传输中的丢包,空域误码掩盖技术使用丢失像素的相邻信息在解码端对它进行恢复。为了提高算法恢复的准确性,该文提出了一种内容自适应的H.264空域误码掩盖算法。该算法根据受损块的边缘像素和编码模式信息,将其内容分为平滑块和边缘块:对于平滑块采用双线形插值的方法;对于边缘块,则结合其边缘像素与编码模式信息选择较好的插值方向。仿真结果表明,对于多种视频序列和不同宏块丢失率,其性能均稳定地优于H.264标准的算法,在25%宏块丢失率下,恢复视频峰值信噪比相对H.264标准算法提高0.5~3dB。 相似文献
8.
一种高质量语音编解码专用芯片的设计 总被引:2,自引:0,他引:2
为满足中速率高质量语音通信系统的需要 ,采用数字信号处理器内核 (DSP Core)的方法 ,设计了具有国际电信联盟 (ITU )建议 G.72 9A语音编解码器、自适应回声抵消和单路同步功能的专用芯片。根据所用数字信号处理器内核的特点 ,对 G.72 9A算法进行了优化 ,降低了算法复杂度和所需存储空间 ,实现了 G.72 9A全部功能 ,并通过了全部ITU测试序列的检验。回声抵消部分使用归一化最小二乘(NL MS)自适应滤波器实现 ,并设计了近端语音活动性检测和非线性残余回声抑制等功能模块 ,使其性能完全符合 ITU建议 G.16 5各项指标要求。在单路同步模块中 ,使用了并行模二比特排除方法 ,具有同步扑捉快、抗信道误码能力强的优点。专用芯片使用较少的资源 ,在一块芯片上集成了以上全部功能 相似文献
9.
在低速率语音编码算法中,如何对特征参数进行有效的量化表示是影响声码器合成语音质量的关键因素。该文提出一种能量参数解码端恢复算法,它利用线谱频率(linespectral frequency,LSF)和清浊音判决参数(unvoiced/voiced decision,U/V)估计能量参数的变化轨迹。该算法利用特征参数之间的相关性,采用隐Markov模型(hiddenMarkov model,HMM)描述LSF、U/V和能量参数之间的统计特性,通过对能量进行解码端恢复,省去量化所需的比特数,从而提高特征参数的整体量化性能。测试结果表明:能量参数解码端恢复算法能够将150b/s混合激励线性预测编码算法(mixed excitation linear prediction,MELP)的合成语音平均意见得分(mean opinion score,MOS)提高0.042。该算法应用于超低速率声码器参数量化是可行的。 相似文献
10.
正弦激励线性预测声码器子带清浊音模糊判决 总被引:1,自引:0,他引:1
为了解决目前正弦激励线性预测声码器中各子带的清浊音硬判决使得语音帧间产生明显过渡感的问题,提出一种子带清浊音模糊判决算法,直接采用自相关函数对各子带的清浊音度进行描述,矢量量化后传输至解码端,用于激励信号的产生.测试结果表明: 采用子带清浊音模糊判决算法,能够消除语音帧间的过渡感,能够使各种速率正弦激励线性预测声码器的平均主观意见得分提高约0.05以上. 相似文献