期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于心理声学模型的自适应音频数字水印算法 总被引：1，自引：0，他引：1

李云剑陈亮张雄伟《中山大学学报(自然科学版)》2004,43(Z2):204-208

提出一种基于心理声学模型的频域音频数字水印算法.首先对音频信号分段进行离散傅立叶变换(DFT),再利用心理声学模型估算各段掩蔽阈值,使水印信号嵌入DFT域低频子带区时自适应处于掩蔽阈值以下,对音频品质冲击小,含水印音频信号与原始信号感知相似.实验表明本算法具有良好的不可觉察性和稳健性. 相似文献

2.

基于心理声学模型的音频隐藏图像算法

李云剑陈亮张雄伟《解放军理工大学学报(自然科学版)》2005,6(6):545-549

提出一种利用人耳的掩蔽效应,将图像隐藏于音频信号中,实现图像在音频中隐秘传输的算法。算法将音频信号分帧进行心理声学模型分析,估计频域中各子带的最小掩蔽阈值;然后将图像转化为比特流隐藏于音频信号频域子带,并用掩蔽阈值控制嵌入强度。仿真结果表明,隐藏有图像的音频信号主观无感知失真且图像具有不可见性,对加噪、压缩、滤波和重采样等攻击具有良好的鲁棒性。相似文献

3.

一种基于音频词袋的暴力视频分类方法

李荣杰蒋兴浩孙锬锋《上海交通大学学报》2011,45(2):214-0218

针对网络视频的监管需求,提出了一种基于音频词袋的暴力视频分类方法.采用提取视频中音频流的多媒体内容描述接口（MPEG 7）音频特征（包括音频频谱质心,音频频谱带宽等低层音频特征.）及MPEG 7高层特征——音频签名,来构造每段视频特有的音频词汇,采用该音频词汇出现的频率形成音频词袋特征.采用支持向量机对暴力和非暴力视频进行分类.把词袋模型应用到暴力音频特征分类中,对于不同音频词汇量采用了独特的词汇权重分配机制,同时借助特有的针对暴力视频的分类策略,以提高分类效果.通过3组实验,对不同的音频特征的准确率、不同词汇的分类效果、以及对视觉特征粗分类的精确分类进行了研究.实验结果表明,该方法有较好的查全率. 相似文献

4.

HDTV音频解码系统算法优化及实现

杨杰郭立《安徽师范大学学报(自然科学版)》2009,32(3):234-238

Dolby AC-3是杜比实验室的第三代感知音频编解码系统,将心理声学模型溶入其中,大大地提高了编解码性能.本文介绍了Dolby AC-3音频标准解码算法的基本原理,并通过C程序实现该解码算法.详细推导了用两个N/4点的DCT-II来实现N点的改进离散余弦反变换(IMDCT)解码单元的优化算法,将此AC-3解码算法进行仿真试验,对仿真结果进行主客观评价.评价结果显示解码速度得到提高,为AC-3解码器的实时实现奠定了基础. 相似文献

5.

基于听觉感知特性的FFT域自适应音频隐写算法

张学强陈振宇李刚磊《科技信息》2011,(34):142-143

本文在研究人耳听觉感知特性的基础上,改进了FFT域音频隐写算法。算法利用心理声学模型对音频信号进行分析,选取中低频子带部分低于掩蔽阈值的点位上嵌入秘密信息,嵌入强度自适应于音频段能量大小,同时采用单极性系数量化原理实现盲提取,通过实验验证了算法具有良好的不可感知性和较强的鲁棒性。相似文献

6.

基于心理声学模型的自适应音频数字水印算法

李云剑陈亮张雄伟《中山大学学报(自然科学版)》2004,43(2):204-208

提出一种基于心理声学模型的频域音频数字水印算法。首先对音频信号分段进行离散傅立叶变换(DFT)，再利用心理声学模型估算各段掩蔽阈值，使水印信号嵌入DFT域低频子带区时自适应处于掩蔽阈值以下，对音频品质冲击小，含水印音频信号与原始信号感知相似。实验表明本算法具有良好的不可觉察性和稳健性。相似文献

7.

基于心理声学模型数字音频水印算法

赵红《漳州师范学院学报》2009,22(4):31-35

提出了一种将心理声学模型和小波变换、离散余弦变换相结合的数字音频水印算法,根据人耳听觉系统的掩蔽效应,计算载体音频信号的掩蔽阈值.为了消除图像水印的像素相关性,首先对水印图像进行置乱,以增强水印信号的安全性.然后将水印信号嵌入到小波变换近似分量的DCT变换域中,嵌入强度由掩蔽阈值自适应控制.仿真实验结果表明:该算法隐藏水印具有很强的不可感知性;叠加了水印的音频信号对数据压缩、加噪、重新采样、重新量化、低通滤波等常用的音频信号处理技术具有很好的鲁棒性. 相似文献

8.

无感知音频信号数字水印技术

刘兵杨鉴《云南大学学报(自然科学版)》2003,25(5):408-411

从时域统计的音频信号数字水印技术出发,提出一种无感知音频信号数字水印方法,该方法以ISO/IEC11172-3(MPEG-Audio)中定义的心理声学模型作为数字水印产生的模型,使嵌入到音频信号中的水印信息最大可能地被掩蔽,保证声信号的质量.根据统计模型,检测时可在不需要原声信号的情况下对数字水印的有无作出判决. 相似文献

9.

可变码率压缩和音速、音调调整的音频信号的正弦模型

尹俊勋宋少鹏《华南理工大学学报(自然科学版)》2003,31(7):22-27

提出一种用于可变码率音频编码的正弦噪声(SN)模型．提出了对正弦模型进行本质上的增强．从大、中、小三个前后衔接的尺度上对音频信号进行时域重叠相加(overlap-add)的正弦分析时引入了心理声学模型加权的匹配跟踪算法(matching pursuits algorithm)，将大尺度正弦分析-合成后的余量送入相对小的尺度进行分析，以达到相应的分辨率．这种算法有效的解决了正弦模型固有的预回声效应，提高了重建音频的质量．这一模型适用于可变码率、高保真的音频压缩和发音速度、音调的调整．相似文献

10.

基于改进小波包变换的一种音频编码算法

张良智郑应文《上海交通大学学报》2002,36(Z1):55-58

对音频编码中基于自适应小波包分解在前人基础上作了进一步的探讨,对最优小波包的选择进行了优化,根据应兼顾实时计算复杂度和音频信号能量集中在低频的特点,提出一改进的自适应小波包分解算法,并采用基于心理声学模型的零树编码,使该系统对语音信号有较高的压缩比,同时能保持良好的实时性和客观恢复信噪比. 相似文献

11.

非均匀快速傅立叶变换在音频编码中的应用

邓峥卢晶《南京大学学报(自然科学版)》2009,45(1)

在音频变换编码中,一般采取均匀变换的方法进行频谱分析和心理声学模型计算,比如快速傅立叶变换（FFT）,移位离散傅立叶变换（SDFT）和改进离散余弦变换（MDCT）.但均匀频谱分析方法并不符合人耳听觉特性,需要进行额外的非线性映射,并且在低频段分辨率不足.本文在音频编码中引入非均匀快速傅立叶变换（NUFFT）,可以直接使频谱在不同频段具有不同的频率分辨率,非常有利于提高编码效率同时根据音频编码的需求提出一种专门的近似求逆方法,尽管这种方法存在一定误差,但是可以证明这些误差主要与人耳不敏感的高频信息有关,并且采用此种近似求逆方法,NUFFT相对于FFT有更好的算法稳定性.最后给出了利用NUFFT和FFT进行变换操作的测试结果,从数据精度和客观音质评价两方面都说明在低码率下NUFFT的表现优于FFT. 相似文献

12.

音质模型及其在MPEG-2中的应用

唐芬杨绍国李庆国《成都理工大学学报(自然科学版)》2002,29(2):224-226

MPEG-2是一种高质量的音视频压缩国际标准。作者对 MPEG-2的音质模型的理论及实现方法进行了研究 ,实现了音频压缩编码的自适应比特分配相似文献

13.

基于MPEG-1/2视频的音频同步剪辑算法

王立平罗森林成华《北京理工大学学报》2002,22(6):746-749

根据MPEG-1/2码流的特点,实现视音频同步编辑算法.通过对MPEG-1/2视音频码流的分析,利用两者的PTS值实现了基于MPEG-1/2码流PES层的非线性视音频同步编辑,并详述了剪辑算法.该算法无音频编解码操作,实时性好,不存在音频质量损失问题;对于少数次的剪辑同步效果很好.该算法实用性强,现已将该算法模块应用于非线性编辑系统中. 相似文献

14.

Quantization of wavelet packet audio coding

谭建国 Zhang Wenjun LiuPeilin 《高技术通讯(英文版)》2006,12(3):295-299

Abstract The method of quantization noise control of audio coding in the wavelet domain is proposed. Using the inverse Discrete Fourier Transform （DFT）, it converts the masking threshold coming from MPEG psycho-acoustic model in the frequency domain to the signal in the time domain; the Discrete Wavelet Packet Transform （DWPF） is performed; the energy in each subband is regarded as the maximum allowed quantization noise energy. The experimental result shows that the proposed method can attain the nearly transparent audio quality below 64kbps for the most testing audio signals. 相似文献

15.

MUSICAM算法仿真及DSP实现 总被引：2，自引：1，他引：2

陈健李力利《上海交通大学学报》1997,31(1):62-66

介绍了ＭＰＥＧ声音压缩编码采用ＭＵＳＩＣＡＭ算法的计算机仿真过程及用定点ＤＳＰ实现这种算法的结果，并给出编解码器各子功能块所占运算量和存储器容量。相似文献

16.

W99200F在航空音视频记录系统中的应用

下载免费PDF全文

张立东张登福毕笃彦《空军工程大学学报(自然科学版)》2002,3(2):20-23

叙述了MPEG编码芯片W99200F的主要特点和工作方式，给出了该芯片的机载音视频记录系统电路和软件设计流程，该系统适用于战机作战情况事后分析和平时作战训练效果评判。相似文献

17.

一种自适应的同步音频水印算法 总被引：3，自引：0，他引：3

施化吉唐慧郑洪源李星毅丁秋林《华南理工大学学报(自然科学版)》2008,36(9)

针对Garcia水印算法[1]所存在的不足,提出一种改进的自适应同步音频水印算法。算法具有以下特点:(1)应用声学模型,利用载体掩蔽阈值选择嵌入位置,以保证水印的隐藏性;(2)在时域嵌入同步码以抵制可能受到的同步攻击;(3)将音频载体进行分段,在每段音频自适应嵌入水印,并在每个段首嵌入段号以区别不同音频段;(4)利用数据冗余性,重复嵌入多份水印以提高水印提取的成功率。实验结果表明,水印具有较好的隐藏性、鲁棒性和抗同步性。相似文献

18.

基于MPEG心理声学模型II的自适应音频水印算法 总被引：3，自引：0，他引：3

王泳李斌《中山大学学报(自然科学版)》2006,45(2):29-32

音频水印作为保护音频作品的版权和秘密通信的可行方法,成为近年数字水印研究领域中的一个热点。针对目前音频水印算法研究中自适应性能没有得到重视的问题,提出一种基于心理声学模型II(以下称模型II)的自适应盲检测音频水印算法,令算法具备良好的自适应性和稳健性。相似文献

19.

面向实时通信的低延迟高质量音频编码算法 总被引：3，自引：0，他引：3

杜维涛《科学技术与工程》2013,13(7):1970-1974

提出了一种新的低延迟高质量音频编码算法,主要面向交互式的实时通信。为了降低编解码算法延迟,采用了相对较短、长度固定的变换窗,从而大幅度地降低了算法延迟。同时,为了在高压缩比下获得高质量的音频,运用修正的离散余弦变换(MDCT)的分析方法,不仅降低了算法复杂度,同时也提高了分析的精确度。算法的提出弥补了传统音频编码算法和语音编码算法的不足,它不仅具有较低的编解码算法延迟,而且在编码效率、音质和算法复杂度等方面,可以与时下的其它高级感知音频编码算法相媲美。相似文献