首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 109 毫秒
1.
为降低谱包络参数的量化失真,研究了谱包络参数的平滑算法,称为DCT-S算法.谱包络参数用线谱频率(LSF)参数表示,用离散余弦变换(DCT)对多帧线谱频率(LSF)参数每一维组成的矢量进行变换,然后对DCT系数进行截断,再进行反离散余弦变换,得到LSF参数的平滑轨迹.测试表明,应用DCT-S算法,在LSF参数单帧矢量量化时,平均谱失真下降了约 0.23 dB;在LSF参数多帧联合矢量量化时,平均谱失真下降了约0.25~0.45 dB. 实验结果表明,DCT-S算法使谱包络参数的变化轨迹得到了平滑,有效地降低了谱失真.  相似文献   

2.
为了提高语音感知哈希算法的鲁棒性和识别小范围篡改定位的能力,利用人类听觉模型提出了一种语音感知哈希算法.该算法基于人类听觉特性,首先对倒谱系数MFCC算法每帧的滤波器数量进行控制,得到每帧语音的梅尔频率倒谱参数;其次对自适应梅尔倒谱系数MFCC参数和语音LPCC系数进行融合,并采用分块方法对特征矩阵进行处理,对特征块进行2DNMF分解运算,降低特征矩阵的复杂度;最后对分解后的系数矩阵进行哈希构造,得到语音感知哈希串,利用哈希匹配实现语音认证.结果表明:该算法可以有效提高哈希认证的鲁棒性,并能够实现语音小范围篡改定位功能.  相似文献   

3.
为了实现高质量低速率语音编码,提出了高效线性预测Gauss混合模型(Gaussianmixturemodel,GMM)线谱频率参数量化算法(LP-GMM-LSFQA)。线谱频率(linearspectralfrequency,LSF)参数先去均值,经过一阶线性预测,得到残差信号,将残差用协方差矩阵为对角阵GMM量化算法进行量化。在此基础上,利用反量化后参数自适应更新GMM的加权系数和均值,进一步提出了预测自适应GMM-LSF量化算法(LP-AGMM-LSFQA)。实验表明LP-GMM-LSFQA在20b/帧时量化性能超过预测分裂矢量量化22b/帧时的量化性能,节约2b/帧;LP-AGMM-LSFQA量化性能优于LP-GMM-LSFQA。  相似文献   

4.
为了满足移动语音通信中对语音内容保持操作的鲁棒性和区分性,并实现高效认证等要求,提出一种基于线性预测最小均方差(LP-MMSE)的高效语音感知哈希认证算法.该算法首先对待认证语音进行预处理、分帧和加窗后的语音信号进行线性预测分析(LPC)得到其最小均方差(MMSE)系数矩阵;然后对分帧后的语音利用谱熵法计算得到每帧的谱熵值参数矩阵;最后结合上述两个矩阵,生成最终的二进制感知哈希序列.仿真结果表明,该算法的感知哈希摘要性优于现有的其它方法并对内容保持操作具有较好的鲁棒性和区分性,认证效率高,能够满足语音通信实时认证的要求.  相似文献   

5.
为了实现高质量低速率的语音编码,提出了高效线性预测Gauss混合模型(Gaussian mixture model,GMM)线谱频率参数量化算法(LP-GMM-LSFQA)。线谱频率(linear spectral frequency,LSF)参数先去均值,经过一阶线性预测,得到残差信号,将残差用协方差矩阵为对角阵GMM量化算法进行量化。在此基础上,利用反量化后参数自适应更新GMM的加权系数和均值,进一步提出了预测自适应GMM-LSF量化算法(LP-AGMM-LSFQA)。实验表明:LP-GMM-LSFQA在20 b/帧时量化性能超过预测分裂矢量量化22 b/帧时的量化性能,节约2b/帧;LP-AGMM-LSFQA量化性能优于LP-GMM-LSFQA。  相似文献   

6.
针对现有压缩感知图像序列重建算法重建精度不高、模型参数设置较多的问题,提出了一种结合稀疏支撑集先验和残差补偿的算法.在已知前一帧图像重建结果的基础上,通过求解1个最小化加权l1范数问题得到当前帧图像的初始估计.通过对估计残差进行压缩感知重建并对初始估计加以补偿,得到当前帧图像的最终重建结果.与其他同类算法相比,该算法减少了阈值参数的设置.实验结果表明,在相同的测量值数目下,该算法重建图像的相对误差、峰值信噪比和结构相似度指标均优于同类比较算法.  相似文献   

7.
为在极低速率下实现高质量的语音编码,提出了一种新的有效的线谱对(LSP)参数量化算法——P-RS-MSMQ算法。此算法以多帧联合矩阵量化作为基本框架,引入了基于超级帧模式的均值去除和帧间预测策略、矩阵分裂和子矩阵多级量化策略;同时提出了基于语音帧短时谱能量的帧内加权和基于超级帧中各子帧重要性的帧间加权策略等。实验表明:此算法能够在700b/s的速率下获得接近透明量化的性能;即使在300~400b/s的极低速率下也具有较高质量的量化效果。因此该算法的实现对极低速率语音编码算法的研究具有重要的意义。  相似文献   

8.
现有的视频压缩感知(CVS)多假设预测方法均以当前块在参考帧对应搜索范围内的所有搜索块为假设块,造成求解线性权值系数的计算复杂度过高和预测精度受限.针对该问题,文中提出了一种基于多参考帧的最优多假设预测视频压缩感知重构算法.该算法首先从多个参考帧中选取出与当前块测量域绝对差值和(SAD)最小的一部分搜索块作为当前块的最优假设块集,然后对假设块进行自适应线性加权,充分地挖掘视频帧间相关信息,提升了预测精度,同时降低了求解线性权值系数的计算复杂度;最后对测量值进行帧间DPCM量化,以提高视频压缩效率和率失真性能.仿真实验表明,与现有的视频压缩感知重构算法相比,文中算法具有更高的视频重构质量.  相似文献   

9.
针对语音信号在变换域中不够稀疏使得压缩感知重建困难的问题,提出了一种利用频域结构特征的重建算法.该算法为单帧语音信号的修正离散余弦变换系数引入幅度和状态2个隐变量,并分别用高斯马尔可夫过程和马尔可夫链对幅度和状态沿频率轴的连续性建模.在此基础上用因子图表示系数及其幅度、状态的联合后验分布,在因子图上用Turbo消息传递迭代求出系数的后验均值,进而重建原始语音信号.与当前几种最新的算法相比,该算法在不同帧长、不同压缩率下均获得更高的重建精度,重建信号在时频图上的能量分布也与原始语音最为接近.可见,利用语音频域系数的连续性,以Turbo消息传递的方式可以在压缩感知中得到较高的重建精度.  相似文献   

10.
在增强型混和激励线性预测(MELPe)模型的基础上,提出了一种高音质的600 bps声码器算法。保持MELPe算法特征的同时,利用帧间参数冗余,进行多帧联合量化;运用基于预测的分级矢量量化(PMSVQ)算法对线谱频率(LSF)参数进行量化。在非正式的主观语音质量测试中,合成语音质量优于传统的LPC10e声码器,接近2 400 bpsMELP标准的合成语音。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号