首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
基于心理声学模型的自适应音频数字水印算法   总被引:1,自引:0,他引:1  
提出一种基于心理声学模型的频域音频数字水印算法.首先对音频信号分段进行离散傅立叶变换(DFT),再利用心理声学模型估算各段掩蔽阈值,使水印信号嵌入DFT域低频子带区时自适应处于掩蔽阈值以下,对音频品质冲击小,含水印音频信号与原始信号感知相似.实验表明本算法具有良好的不可觉察性和稳健性.  相似文献   

2.
提出一种利用人耳的掩蔽效应,将图像隐藏于音频信号中,实现图像在音频中隐秘传输的算法。算法将音频信号分帧进行心理声学模型分析,估计频域中各子带的最小掩蔽阈值;然后将图像转化为比特流隐藏于音频信号频域子带,并用掩蔽阈值控制嵌入强度。仿真结果表明,隐藏有图像的音频信号主观无感知失真且图像具有不可见性,对加噪、压缩、滤波和重采样等攻击具有良好的鲁棒性。  相似文献   

3.
针对网络视频的监管需求,提出了一种基于音频词袋的暴力视频分类方法.采用提取视频中音频流的多媒体内容描述接口(MPEG 7)音频特征(包括音频频谱质心,音频频谱带宽等低层音频特征.)及MPEG 7高层特征——音频签名,来构造每段视频特有的音频词汇,采用该音频词汇出现的频率形成音频词袋特征.采用支持向量机对暴力和非暴力视频进行分类.把词袋模型应用到暴力音频特征分类中,对于不同音频词汇量采用了独特的词汇权重分配机制,同时借助特有的针对暴力视频的分类策略,以提高分类效果.通过3组实验,对不同的音频特征的准确率、不同词汇的分类效果、以及对视觉特征粗分类的精确分类进行了研究.实验结果表明,该方法有较好的查全率.  相似文献   

4.
Dolby AC-3是杜比实验室的第三代感知音频编解码系统,将心理声学模型溶入其中,大大地提高了编解码性能.本文介绍了Dolby AC-3音频标准解码算法的基本原理,并通过C程序实现该解码算法.详细推导了用两个N/4点的DCT-II来实现N点的改进离散余弦反变换(IMDCT)解码单元的优化算法,将此AC-3解码算法进行仿真试验,对仿真结果进行主客观评价.评价结果显示解码速度得到提高,为AC-3解码器的实时实现奠定了基础.  相似文献   

5.
本文在研究人耳听觉感知特性的基础上,改进了FFT域音频隐写算法。算法利用心理声学模型对音频信号进行分析,选取中低频子带部分低于掩蔽阈值的点位上嵌入秘密信息,嵌入强度自适应于音频段能量大小,同时采用单极性系数量化原理实现盲提取,通过实验验证了算法具有良好的不可感知性和较强的鲁棒性。  相似文献   

6.
提出一种基于心理声学模型的频域音频数字水印算法。首先对音频信号分段进行离散傅立叶变换(DFT),再利用心理声学模型估算各段掩蔽阈值,使水印信号嵌入DFT域低频子带区时自适应处于掩蔽阈值以下,对音频品质冲击小,含水印音频信号与原始信号感知相似。实验表明本算法具有良好的不可觉察性和稳健性。  相似文献   

7.
提出了一种将心理声学模型和小波变换、离散余弦变换相结合的数字音频水印算法,根据人耳听觉系统的掩蔽效应,计算载体音频信号的掩蔽阈值.为了消除图像水印的像素相关性,首先对水印图像进行置乱,以增强水印信号的安全性.然后将水印信号嵌入到小波变换近似分量的DCT变换域中,嵌入强度由掩蔽阈值自适应控制.仿真实验结果表明:该算法隐藏水印具有很强的不可感知性;叠加了水印的音频信号对数据压缩、加噪、重新采样、重新量化、低通滤波等常用的音频信号处理技术具有很好的鲁棒性.  相似文献   

8.
 从时域统计的音频信号数字水印技术出发,提出一种无感知音频信号数字水印方法,该方法以ISO/IEC11172-3(MPEG-Audio)中定义的心理声学模型作为数字水印产生的模型,使嵌入到音频信号中的水印信息最大可能地被掩蔽,保证声信号的质量.根据统计模型,检测时可在不需要原声信号的情况下对数字水印的有无作出判决.  相似文献   

9.
提出一种用于可变码率音频编码的正弦 噪声(SN)模型.提出了对正弦模型进行本质上的增强.从大、中、小三个前后衔接的尺度上对音频信号进行时域重叠相加(overlap-add)的正弦分析时引入了心理声学模型加权的匹配跟踪算法(matching pursuits algorithm),将大尺度正弦分析-合成后的余量送入相对小的尺度进行分析,以达到相应的分辨率.这种算法有效的解决了正弦模型固有的预回声效应,提高了重建音频的质量.这一模型适用于可变码率、高保真的音频压缩和发音速度、音调的调整.  相似文献   

10.
对音频编码中基于自适应小波包分解在前人基础上作了进一步的探讨,对最优小波包的选择进行了优化,根据应兼顾实时计算复杂度和音频信号能量集中在低频的特点,提出一改进的自适应小波包分解算法,并采用基于心理声学模型的零树编码,使该系统对语音信号有较高的压缩比,同时能保持良好的实时性和客观恢复信噪比.  相似文献   

11.
在音频变换编码中,一般采取均匀变换的方法进行频谱分析和心理声学模型计算,比如快速傅立叶变换(FFT),移位离散傅立叶变换(SDFT)和改进离散余弦变换(MDCT).但均匀频谱分析方法并不符合人耳听觉特性,需要进行额外的非线性映射,并且在低频段分辨率不足.本文在音频编码中引入非均匀快速傅立叶变换(NUFFT),可以直接使频谱在不同频段具有不同的频率分辨率,非常有利于提高编码效率 同时根据音频编码的需求提出一种专门的近似求逆方法,尽管这种方法存在一定误差,但是可以证明这些误差主要与人耳不敏感的高频信息有关,并且采用此种近似求逆方法,NUFFT相对于FFT有更好的算法稳定性.最后给出了利用NUFFT和FFT进行变换操作的测试结果,从数据精度和客观音质评价两方面都说明在低码率下NUFFT的表现优于FFT.  相似文献   

12.
MPEG-2是一种高质量的音视频压缩国际标准。作者对 MPEG-2的音质模型的理论及实现方法进行了研究 ,实现了音频压缩编码的自适应比特分配  相似文献   

13.
根据MPEG-1/2码流的特点,实现视音频同步编辑算法.通过对MPEG-1/2视音频码流的分析,利用两者的PTS值实现了基于MPEG-1/2码流PES层的非线性视音频同步编辑,并详述了剪辑算法.该算法无音频编解码操作,实时性好,不存在音频质量损失问题;对于少数次的剪辑同步效果很好.该算法实用性强,现已将该算法模块应用于非线性编辑系统中.  相似文献   

14.
Abstract The method of quantization noise control of audio coding in the wavelet domain is proposed. Using the inverse Discrete Fourier Transform (DFT), it converts the masking threshold coming from MPEG psycho-acoustic model in the frequency domain to the signal in the time domain; the Discrete Wavelet Packet Transform (DWPF) is performed; the energy in each subband is regarded as the maximum allowed quantization noise energy. The experimental result shows that the proposed method can attain the nearly transparent audio quality below 64kbps for the most testing audio signals.  相似文献   

15.
MUSICAM算法仿真及DSP实现   总被引:2,自引:1,他引:2  
介绍了MPEG声音压缩编码采用MUSICAM算法的计算机仿真过程及用定点DSP实现这种算法的结果,并给出编解码器各子功能块所占运算量和存储器容量。  相似文献   

16.
叙述了MPEG编码芯片W99200F的主要特点和工作方式,给出了该芯片的机载音视频记录系统电路和软件设计流程,该系统适用于战机作战情况事后分析和平时作战训练效果评判。  相似文献   

17.
一种自适应的同步音频水印算法   总被引:3,自引:0,他引:3  
针对Garcia水印算法[1]所存在的不足,提出一种改进的自适应同步音频水印算法。算法具有以下特点:(1)应用声学模型,利用载体掩蔽阈值选择嵌入位置,以保证水印的隐藏性;(2)在时域嵌入同步码以抵制可能受到的同步攻击;(3)将音频载体进行分段,在每段音频自适应嵌入水印,并在每个段首嵌入段号以区别不同音频段;(4)利用数据冗余性,重复嵌入多份水印以提高水印提取的成功率。实验结果表明,水印具有较好的隐藏性、鲁棒性和抗同步性。  相似文献   

18.
基于MPEG心理声学模型II的自适应音频水印算法   总被引:3,自引:0,他引:3  
音频水印作为保护音频作品的版权和秘密通信的可行方法,成为近年数字水印研究领域中的一个热点。针对目前音频水印算法研究中自适应性能没有得到重视的问题,提出一种基于心理声学模型II(以下称模型II)的自适应盲检测音频水印算法,令算法具备良好的自适应性和稳健性。  相似文献   

19.
面向实时通信的低延迟高质量音频编码算法   总被引:3,自引:0,他引:3  
提出了一种新的低延迟高质量音频编码算法,主要面向交互式的实时通信。为了降低编解码算法延迟,采用了相对较短、长度固定的变换窗,从而大幅度地降低了算法延迟。同时,为了在高压缩比下获得高质量的音频,运用修正的离散余弦变换(MDCT)的分析方法,不仅降低了算法复杂度,同时也提高了分析的精确度。算法的提出弥补了传统音频编码算法和语音编码算法的不足,它不仅具有较低的编解码算法延迟,而且在编码效率、音质和算法复杂度等方面,可以与时下的其它高级感知音频编码算法相媲美。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号