首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 281 毫秒
1.
面向实时通信的低延迟高质量音频编码算法   总被引:3,自引:0,他引:3  
提出了一种新的低延迟高质量音频编码算法,主要面向交互式的实时通信。为了降低编解码算法延迟,采用了相对较短、长度固定的变换窗,从而大幅度地降低了算法延迟。同时,为了在高压缩比下获得高质量的音频,运用修正的离散余弦变换(MDCT)的分析方法,不仅降低了算法复杂度,同时也提高了分析的精确度。算法的提出弥补了传统音频编码算法和语音编码算法的不足,它不仅具有较低的编解码算法延迟,而且在编码效率、音质和算法复杂度等方面,可以与时下的其它高级感知音频编码算法相媲美。  相似文献   

2.
在基于包方式传输的网络中进行高频信号的实时传输时,利用信号模型对信号进行压缩有强大的生命力。基于帧结构的匹配跟踪原理,提出了一种有效而灵活的正弦模型分解方法。利用匹配跟踪算法,通过迭代抽取每帧信号的一组正弦成分,把这些成分通过帧重叠相加就可以重构原来的信号。使用高频域的快速傅氏变换算法(FFT)能有效快速地实现整个模型。本文提出的方法可用于信号压缩和调整,由于抽取的正弦成分是以人耳感觉的好坏排序的,因此该方法特别适合于音频信号的逐级压缩。  相似文献   

3.
基于利用人的听觉心理模型对音频信号进行压缩的管理,描述了MPEG音频压缩标准所采有的MUSICAM算法,并提出了MPEG-Ⅱ实时编码系统中音频编码模块的实现方案,该方案利用手机CPU来完成音频编码的工作,既可充分利用系统资源,又可降低成本,实践表明,该方案满足实时性,稳定性等方面的设计要求。  相似文献   

4.
音频信号的感知编码技术研究   总被引:2,自引:0,他引:2  
感知编码是利用人耳听觉的心理声学特性,将凡是人耳感觉不到的成分不编码不传送的一种编码技术.本文主要介绍了音频感知编码的相关知识,绝对听觉门限和听觉掩蔽效应,以及感知编码器的基本原理.最后,本文着重描述了感知编码技术的发展和一些利用感知编码的音频编码标准,主要MPEG-1、MPEG-2、杜比AC-3、AAC、DTS和AVS音频编码技术.  相似文献   

5.
基于小波变换的自适应音频数字水印算法   总被引:2,自引:0,他引:2  
提出了一种新的小波域音频数字水印算法。它先对水印序列进行伪随机排序,然后自适应地把水印嵌入到原语音信号小波分解中等尺度绝对值较大的分量上。仿真实验证明了算法的稳健性和不可觉察性。  相似文献   

6.
压缩格式已经成为了音频信号存储和传输的主要形式,面向压缩域音频文件的识别方案就显得更具有实际意义。提出了一种基于音频指纹的压缩域音频识别算法,该算法可用于压缩域音频和非压缩域音频在同一个指纹数据库中进行有效检索和识别。选择最典型的音频压缩格式——MP3音频来测试算法的性能,实验结果表明该算法的指纹尺寸小,具有较好的指纹区分性和较高的正确识别率,对各种常见的时频域失真均具有较强的鲁棒性。  相似文献   

7.
提出了一种针对MPEG-2 AAC压缩音频的脆弱水印算法.该算法利用了AAC中MDCT量化系数大于15的Huffman编码特性来嵌入水印,并依据水印的频率分布和音频信号感知熵PE的大小对嵌入算法进行了分析和改进.实验表明,该算法具有较高隐藏率和良好的不可感知性,并且水印的嵌入和提取过程十分方便快速,适合进行实时分析.  相似文献   

8.
Huffman码的码字只能由整数比特逼近符合的熵,同时它的母符概率模型要做自适应调整非常困难,为克服这些局限进一步提高编码效率,提出用算术编码对先进音频编码器(AAC)的缩放因子进行无损编码,实验验证了该方法的可行性和有效性,表明算术编码在音频编码中具有良好的应用前景。  相似文献   

9.
对音频编码中基于自适应小波包分解在前人基础上作了进一步的探讨,对最优小波包的选择进行了优化,根据应兼顾实时计算复杂度和音频信号能量集中在低频的特点,提出一改进的自适应小波包分解算法,并采用基于心理声学模型的零树编码,使该系统对语音信号有较高的压缩比,同时能保持良好的实时性和客观恢复信噪比.  相似文献   

10.
老电影音频资料经过长时间的存储会出现音频纯度低、存在噪声等问题.利用非负矩阵分解(non-negative matrix factorization,NMF)算法对单声道音频中的背景噪声进行自动、快速检测和分离以去噪.对非噪声和噪声信号分别建立相应的模型,即前者使用正弦模型;后者的模型通过对老电影中先验噪声信号进行训练得到,然后使用一种条件受限的NMF算法对音频中的背景噪声进行分离.实验结果表明,该算法在去噪效果上要优于直接滤波等去噪算法.  相似文献   

11.
A novel audio watermarking scheme using multiscale wavelet modulation   总被引:3,自引:0,他引:3  
A novel audio watermarking scheme to embed robust and inaudible watermarks for the purpose of copyright protection is proposed. The key innovation is to add time-frequency redundancy into watermark signals by multiscale wavelet modulation. In order to maximize the watermarking strength within perceptual constraints, the signals synthesized from different scales are masked using a frequency auditory model, respectively, and then intergrated to form the final watermark signal. The detection structure is built using the redundancy in watermark signals, and the performance is further enhanced by modeling the statistical behaviors of wavelet coefficients as generalized Gaussian distribution. The use of original audio signal is not required in watermark detection. The experimental results show that our approach can achieve not only good transparency but also satisfying robustness to common audio manipulations.  相似文献   

12.
A high capacity data hiding technique was developed for compressed digital audio. As perceptual audio coding has become the accepted technology for storage and transmission of audio signals, compressed audio information hiding enables robust, imperceptible transmission of data within audio signals, thus allowing valuable information to be attached to the content, such as the song title, lyrics, composer’s name, and artist or property rights related data. This paper describes simultaneous low bitrate encodin...  相似文献   

13.
为了更好地解决音频与视频同步问题,提出了一种嵌入式音视频混合信号同步压缩编码算法。在发送端将音频信号作为隐藏信息,嵌入视频图像的DCT(Discrete Cosine Transform)系数中,然后对嵌入了音频信号的视频信号进行压缩编码,在接收端从视频信号中提取出音频信息,再对音频和视频信号进行重构,得到恢复后的音频与视频。该方法在不增加音频和视频压缩数据量,同时保证音频和视频主观质量没有明显降低的情况下,实现了音视频信号同步压缩。  相似文献   

14.
非均匀量化器广泛运用在感知音频编码器中.通过对非均匀量化器失真的研究,引入了量化器的群能量失真概念.该概念定义为量化前的原始信号能量和量化后的重建信号能量的误差期望值.根据此概念提出了零群能量失真量化器,这种量化器能使原始信号能量和重建信号能量保持守恒.在量化器的量化电平间使用零群能量失真原则,约束量化电平间的群能量失真,可以获得与原始量化谱分布相关的动态量化区间划分.通过对原始量化谱的分布进行频数统计,近似计算动态量化区间划分,修改量化器的取整方式,使用该近似的动态量化区间划分,实现了随输入信号分布变化的动态调整量化器.客观音质评价实验显示,使用动态调整量化器先进音频编码,与使用标准推荐的量化器相比,在相同比特率下,客观音质评价指标失真指数和噪声掩模比都有所提高,编码器音质得到改进,且音质改进程度随着比特率的增加而增大.而基于对比听音实验的主观音质退化程度比较表明,使用动态调整量化器的先进音频编码,与标准算法相比,在相同码率下有更高的音质还原度 在维持标准算法音质水平的前提下,可节省一定比特率.该动态调整量化器不改变音频编码器自身结构,在不显著增加的计算量和存储量的条件下,提高了编码器性能,且适用于多种类型音频编码器.  相似文献   

15.
在音频变换编码中,一般采取均匀变换的方法进行频谱分析和心理声学模型计算,比如快速傅立叶变换(FFT),移位离散傅立叶变换(SDFT)和改进离散余弦变换(MDCT).但均匀频谱分析方法并不符合人耳听觉特性,需要进行额外的非线性映射,并且在低频段分辨率不足.本文在音频编码中引入非均匀快速傅立叶变换(NUFFT),可以直接使频谱在不同频段具有不同的频率分辨率,非常有利于提高编码效率 同时根据音频编码的需求提出一种专门的近似求逆方法,尽管这种方法存在一定误差,但是可以证明这些误差主要与人耳不敏感的高频信息有关,并且采用此种近似求逆方法,NUFFT相对于FFT有更好的算法稳定性.最后给出了利用NUFFT和FFT进行变换操作的测试结果,从数据精度和客观音质评价两方面都说明在低码率下NUFFT的表现优于FFT.  相似文献   

16.
Abstract The method of quantization noise control of audio coding in the wavelet domain is proposed. Using the inverse Discrete Fourier Transform (DFT), it converts the masking threshold coming from MPEG psycho-acoustic model in the frequency domain to the signal in the time domain; the Discrete Wavelet Packet Transform (DWPF) is performed; the energy in each subband is regarded as the maximum allowed quantization noise energy. The experimental result shows that the proposed method can attain the nearly transparent audio quality below 64kbps for the most testing audio signals.  相似文献   

17.
多信源音频编码是指多个相关音频信源的独立编码和联合解码。它基于分布式信源编码定理,利用信道编码原理和信源之间的相关性实现信源的压缩编码,能在保证输出质量的基础上有效降低编码的复杂度。设计了一种非对称的多信源音频编码算法并进行了分析和仿真。结果表明:该算法编码简单且具有良好的性能。  相似文献   

18.
介绍并实现了一种基于小波的适于实时硬件实现的音频编解码器,对输入音频信号,首先进行差分脉冲预测编码,然后进行整数小波变换,最后进行量化和熵编码,解码过程和编码过程相反。经测试,在每声道64kbps左右,可达到与MP3相近的近似透明音质,且硬件成本低,实现简单。  相似文献   

19.
文章主要讨论如何使用 DSP Builder来实现 MP3音频解码中的 IMDCT。MDCT和 IMDCT是 2种重叠正交变换 ,也是 MPEG音频标准中运算量最大的 2种运算 ,主要应用在数字信号处理当中。采用正弦递归循环公式 ,实现 IMDCT的内核 ,得到一种该变换的高效实现方法 ,这种方法特别适合 VLSI的并行实现  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号