首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
音频信息的检索是多媒体检索技术中的一个重要方面,本文基于数字音频指纹的快速检索算法提出了一种广告检测技术,该算法将音频流分块提取数字音频指纹,然后在广告音频指纹库中粗检索,检索过程中同时得到相似广告的时间偏移及广告长度信息,进而进行完整匹配,实现了广告信息快速完整检索.为了消除音频指纹检索受采样率误差的影响,精细匹配时提出了分割匹配的方法.实验证明,该方法具有检索速度快、受采样率误差影响小的特点.  相似文献   

2.
音频信息的检索是多媒体检索技术中的一个重要方面,本文讨论一种基于音频信号的广告条目检索和定位方法,它利用短时平均过零率和互相关函数从实时音频数据流中快速检测和定位广告条目。  相似文献   

3.
音频信息的检索是多媒体检索技术中的一个重要方面。本文讨论一种基于音频信号的广告条目检索和定位的一种自适应方法,它利用短时平均过零率和互相关函数从实时音频数据流中快速检测和定位广告条目.  相似文献   

4.
基于内容的音频检索是多媒体检索技术中一个重要的组成部分.本文在综述了国内外现行的音频信息检索方法的基础上,通过一种利用声学特征的相似性检索音频文件的方法来分析基于内容的音频检索的关键技术,并在综合运用该关键技术的基础上设计了一个简单的系统对基于内容的音频检索方法进行了测试.  相似文献   

5.
提出了基于Gammachirp耳蜗能量谱的音频时频域特征表示方法,并在此基础上进一步构造了一种音频指纹算法。首先利用非负矩阵分解(Non-negative Matrix Factorization,NMF)提取Gammachirp耳蜗能量谱的局部特征,然后对该局部特征进行差分和量化,以提高算法的鲁棒性,并降低检索的计算复杂度。实验结果表明:在经受音频编辑软件多种攻击和实际环境中录音检索时,本文算法都具有很好的鲁棒性和识别率。  相似文献   

6.
根据广播广告监测的需求,提出一种基于重叠式元胞移位的音频广告检测算法.由于广告类型的多样性,该算法以多种类型的广告作为研究对象,并结合元胞自动机的基本理论和音频本身所具有的特点,采用重叠式元胞移位与互相关函数相结合的检测算法,实现音频广告的检测.实验结果表明:基于重叠式元胞移位的音频广告检测算法可以快速准确地从音频广播节目中检测出广告所在时间段,统计得到广告出现的次数,具有很好的鲁棒性.  相似文献   

7.
针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题, 提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法. 通过提取每帧信号的能量谱包络, 去除部分与说话人相关的特征, 采用Gammatone滤波器组滤波, 经离散余弦变换后再进行倒谱提升, 得到改进的伽马频率倒谱系数特征参数. 将广播音频信号提取特征参数输入隐Markov模型中进行训练测试, 得到的语种识别结果表明, 该方法有效提升了广播音频语种识别的准确率, 优于目前使用的伽马频率倒谱系数特征及其衍生方法.  相似文献   

8.
音频频带扩展是根据接收的宽带信号在解码端人为地重建出丢失的高频成分,以提升音频听觉质量。该文基于耳蜗滤波器倒谱参数提出了一种盲目式音频频带扩展方法。该方法模拟外耳听觉系统,提取耳蜗滤波器倒谱系数来描述宽带音频频谱信息,并利用Gauss混合模型对高频谱包络进行估计。结合基于最近邻匹配的谱细节恢复方法,实现了宽带向超宽带音频的有效扩展。主客观测试表明,该方法的重建音频质量优于基于传统音频特征的扩展方法。  相似文献   

9.
一种基于仿生模式识别思想的固定音频检索方法   总被引:1,自引:0,他引:1  
固定音频检索是指在待检音频中检测和定位与给定查询音频同源的音频片段,它是多媒体检索中的基本问题之一.根据仿生模式识别的基本思想,将查询段映射为高维特征空间中的点,然后考虑各种同源情况对其进行扰动,形成一个超立方体覆盖.通过逐一判断待检段是否位于该覆盖内,即可进行检索.除特征提取外,该方法不需要对待检音频进行额外的预处理.实验结果表明,在加性噪声以及压缩编码的情况下,所提算法均能够快速准确的检出目标.  相似文献   

10.
介绍了音频信号的主要特征和处理技术,给出音频检索系统的处理框架和主流产品,并列出典型检索引擎及应用行业;详细阐述了音频识别和检索的主要方法、基于旋律和内容的音频片段检索的原理和特点;最后结合实验和测试中的实际问题对音频检索进行展望.  相似文献   

11.
随着人们对于场景音频研究的逐渐深入,现有的分析方式由于存在不能完整反映音频的声学特性等弊端,已经无法满足人们的需求。基于时频域特征的分析方式可以很好地解决这一问题,即通过提取场景音频的语谱图,使待分析信号中包含的声学事件得到完整保留,使其表现得更加直观。语谱图中包含着丰富的纹理信息,选取不同窗长,可分别得到场景音频的宽带语谱图和窄带语谱图。对比实验表明,窄带语谱图可以更好的反映出待分析信号中所包含声学事件的趋势、连续性及分布特征。因此对场景音频进行时频域特征分析更适合使用窄带语谱图。  相似文献   

12.
如何有效地对海量数据尤其是诸如音频之类的多媒体数据进行分析、存储和检索是一个有待解决的问题.由于原始音频数据的非结构化特性,音频检索受到极大的限制.相对于日益成熟的图像与视频检索,音频检索相对滞后.基于内容的音频检索己成为多媒体检索技术的研究热点.本文对基于内容的音频检索的音频分层分割算法展开分析,提出一种基于压缩域特征音频分割域识别算法.经试验结果显示,此算法由于不依赖于具体的应用阈值,使此算法准确率有较大提高.  相似文献   

13.
根据工程实践经验,设计了一种用于电视台新闻直播的卫星通信车系统,本系统具有现场直播功能和录播功能,技术指标符合《中华人民共和国广播电影电视行业标准GY/T165—2000》、ITU-RBT.601SMPTE259M数字演播室视频有关标准,以及AES/EBU数字演播室音频有关标准。  相似文献   

14.
文章介绍了广播电视行业常用的音频数字编码方式:非压缩编码(PCM)和压缩编码(MPEG、Dolby、DTS)的原理以及优缺点、应用范围.  相似文献   

15.
下一代广播电视网(NGB)具有交互、定制、迁移、漫游、互通、扩展、控制、追踪、管理、运营功能以及提供高清晰视频、高保真音频、高速数据接入服务等特点。本文提出了以NGB、互联网、物联网、学习资源以及学习终端等构建的NGB移动学习平台模型,探讨了以NGB平台开展移动学习的MRC自主学习、DPI协作学习及OSM实验教学等模式。  相似文献   

16.
时频谱图干扰强,目标之间、目标与干扰之间有重叠,其分割是重要而困难的问题.提出一种基于图像熵定义的时频谱图多尺度形态梯度图像融合方法,将该方法与标记分水岭分割结合形成一种基于多尺度形态梯度和标记分水岭的时频谱图分割方法.实验结果表明,与基于单尺度形态梯度和标记分水岭的分割方法相比,新方法实用性更强;与Otsu法相比,新方法分割更准确.  相似文献   

17.
卷积神经网络模型作为音频特征提取器具有较好的应用效果,但该类模型的训练过程对数据量要求比较高。针对这一问题,本文提出一种基于双重数据增强策略的音频分类方法。首先采用传统音频数据增强方法(旋转、调音、变调、加噪),并将增强后的数据转化为语谱图,再采用随机均值替换法进行谱图增强。在此基础上训练Inception_Resnet_V2神经网络模型作为音频特征提取器,最后训练随机森林模型作为分类器完成音频分类任务。实验结果表明,与已有方法相比,采用双重数据增强策略可明显提升音频分类精度,并且训练出的特征提取模型具有较强的泛化能力。  相似文献   

18.
数字化校园广播以Cobranet实时网络音频传输协议为平台,意义是要满足学校不断增加的语音教学、办公楼、宿舍楼管理等等的需求。该数字化校园广播系统充分利用了以太网络的资源,其功能强大、操作简单,同时其音频的质量可与一些高级传统音频设备抗衡,实现的是广播级的数据传输,而且符合数字化、网络化的要求,其价格与传统设备相比更有优势。  相似文献   

19.
胡帆  刘晓峥 《科技信息》2010,(19):104-104,83
本文介绍了多媒体信息检索的原理与特点,从基于内容的图像检索、视频检索和音频检索的角度对基于内容的多媒体信息检索的研究进展进行了介绍,并对基于内容的多媒体信息检索前景进行了探讨。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号