首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
音频分割是提取音频结构和内容语义的重要手段,是基于内容的音频分析、检索的基础.提出分层熵检测音频分割算法,采用定长分析窗分层结构遍历音频流,窗内根据熵变化趋势检测跳变点.实验结果表明,该算法避免了ΔBIC分割算法中的硬门限判决和数据累积问题,是一种更加有效的音频分割方法.  相似文献   

2.
音频分割是提取音频结构和内容语义的重要手段,是基于内容的音频分析、检索的基础.本文提出一种音频分割算法,采用定长分析窗分层结构遍历音频流,窗内根据熵变化趋势检测跳变点.实验结果表明,该算法避免了△B/C分割算法中的硬门限判决和数据累积问题,是一种更加有效的音频分割方法.  相似文献   

3.
针对广告编辑手法多样导致的广告单元分割较难的问题,提出了融合音频和文本信息的广告单元分割算法.对广告中的音频数据进行高斯混合模型建模,基于分割熵实现音频跳变点检测.沿着时间轴,结合音频跳变点和基于小波变换和支持向量机的文本检测实现对广告单元切换点的第一轮检测.基于时间间隔进行广告单元切换点的第二轮检测.实验证实该算法对广告单元中音频跳变点检测的查全率和查准率高于80%,对广告单元分割的查全率和查准率约为70%.  相似文献   

4.
如何有效地对海量数据尤其是诸如音频之类的多媒体数据进行分析、存储和检索是一个有待解决的问题.由于原始音频数据的非结构化特性,音频检索受到极大的限制.相对于日益成熟的图像与视频检索,音频检索相对滞后.基于内容的音频检索己成为多媒体检索技术的研究热点.本文对基于内容的音频检索的音频分层分割算法展开分析,提出一种基于压缩域特征音频分割域识别算法.经试验结果显示,此算法由于不依赖于具体的应用阈值,使此算法准确率有较大提高.  相似文献   

5.
提出了一种基于背景重建和视差图的立体视频分割算法,利用背景、视差和边缘等信息进行运动对象分割。该算法首先采用基于块的背景重建方法获取视频序列的背景信息,再利用背景相减法获得运动对象的初步分割结果,然后利用立体匹配获得的视差图对初步分割结果进行修正,最后利用边缘信息和后处理操作获得最终的立体视频运动对象。实验表明,该算法能够有效地从运动背景中将视频运动对象完整地提取出来。  相似文献   

6.
就如何从视频序列中分割出具有语义意义的运动对象,本文提出了一种自动的基于背景的运动对象分割算法,利用颜色、形状和灰度等特征对第一帧图像进行初步分割,然后根据帧间运动信息构造背景图像,最后以背景图像和帧差图像作为参考图像,对同一场景中的所有视频帧进行快速可靠的分割.  相似文献   

7.
针对已有的基于RoI的图像压缩方法的不足,提出在初步分割出目标后,进一步在目标的语义方面进行改善,不仅保留对视觉有重要作用的边缘信息,而且基于图像的内容以及目标的语义,保留与目标相关的区域信息.并把这部分区域与已分割出的目标构成广义ROI,最后,对广义的ROI和背景分别用不同的压缩方法进行压缩.对广义ROI采用无损压缩以保留区域信息,对其余部分采用有损压缩以保留边缘信息.实验证明本文方法允许目标近无损分割,并能在不降低压缩比的前提下增强对重建目标的理解.  相似文献   

8.
为了克服基于贝叶斯信息准则(BIC)的音频跳变点检测方法存在的缺陷,提出了音频跳变点的分割熵检测算法.该方法通过检测音频信号内部信息熵的变化趋势来检测跳变点的声学特征.结果表明:该方法可避免因设定固定门限而导致的漏检和数据积累带来的累积误差,能够准确地切分各种声学特性的音频数据,是一种更为直观和有效的跳变点检测方法,具有很高的灵敏度和鲁棒性.  相似文献   

9.
语义对象分割是各种基于内容的多媒体应用领域中的一项关键技术,是近10年来图像与视频处理领域的一个研究热点.从实际应用的角度出发,介绍了三类具有应用价值的语义对象分割方法,即实时的自动对象分割、非实时的交互式对象分割以及针对具体应用的基于先验知识的对象分割.在分析了各类语义对象分割技术的利弊后,指出了语义对象分割技术的进一步研究应该结合高层语义信息来扩大其适用范围,并展望了目前刚刚起步的基于视觉关注度的语义对象分割方法.  相似文献   

10.
为了更好地解决音频与视频同步问题,提出了一种嵌入式音视频混合信号同步压缩编码算法。在发送端将音频信号作为隐藏信息,嵌入视频图像的DCT(Discrete Cosine Transform)系数中,然后对嵌入了音频信号的视频信号进行压缩编码,在接收端从视频信号中提取出音频信息,再对音频和视频信号进行重构,得到恢复后的音频与视频。该方法在不增加音频和视频压缩数据量,同时保证音频和视频主观质量没有明显降低的情况下,实现了音视频信号同步压缩。  相似文献   

11.
提出了一种基于Contourlet域独立分量分析的视频水印.该水印算法首先对视频进行镜头分割;然后对同一镜头中的视频帧分别进行Contourlet分解,并选取分解后的带通分量进行独立分量分析;最后采用邻近特征值平均法将Arnold变换置乱后的水印嵌入到独立分量分析所得的运动分量上.实验结果表明,该算法在保证水印不可见性的同时能够有效地抵抗MPEG压缩及其它常见攻击,并且大大减少了计算量.  相似文献   

12.
基于上下文信息的新闻故事单元分割   总被引:1,自引:0,他引:1  
为了有效检索和管理新闻视频资源,提出了一种利用多模态特征、基于上下文信息的新闻故事单元分割方法。首先利用字幕变化、音频类型和视频镜头类型信息将新闻镜头序列转换成为相应的关键词序列,使新闻故事单元分割转换成为文体序列分割的问题;然后应用一种有效的序列分割模型—条件随机场,来分割新闻故事单元。对多段视频的测试结果证明了该方法的有效性,取得了查全率为72.9%、查准率为88.4%的较好结果。  相似文献   

13.
从视频序列中分割出视频对象是实现基于内容压缩编码方法的关键,该文提出了利用空域和时域信息实现MPEG-4视频对象的自动分割方法,利用相邻两帧的帧差和当前帧的纹理、颜色信息及面部定位、梯度滤波等技术,实现目标的初始化,再利用快速Hausdorff距离法跟踪目标.处理结果表明,该方法对处理相对静止的头肩序列图像具有较强的稳定性,处理速度较快,能取得较好的分割效果。  相似文献   

14.
流媒体技术作为一种新的网络媒体传输方式,解决了动态音、视频信息资源在网络上的传输问题,并实现了视音频资源的数字化管理,增强了用户对视音频资源的可控制性,越来越广泛地应用于视频点播系统.视频点播即交互式多媒体视频点播,是集动态音频、视频和静态图片、文字等信息为一体,为用户提供实时、交互、按需点播服务的系统,用户可以按照自己的意愿进行远程学习、信息查询等,极大地丰富了用户的网络学习和生活.  相似文献   

15.
流媒体技术在教学中的应用   总被引:2,自引:0,他引:2  
描述了流媒体技术在网络视频文件传输中的作用,并将流媒体技术应用于远程教育系统.提出了基于B/S结构开发的远程教育平台中视频子系统的设计方案和实现实例。利用流媒体技术存储教学中的视频类素材,使用Microsoft Producer将电子教案与教学视频素材同步,生成流媒体课件,解决了视频和授课讲稿播放时同步难的问题。最后用JSP技术实现了流媒体课件的点播和实时广播播放。  相似文献   

16.
基于帧间运动的视频分割   总被引:3,自引:0,他引:3  
视频分割是视频结构化和检索的重要技术 ,目前主要通过镜头分割得到。但许多应用需要对镜头根据摄像机运动作分割 ,现有技术不能满足应用实时需要。提出了一种对P帧运动向量稳健分析计算帧间运动并进行分割的方法。与传统光流法、M估计法比较 ,该算法只在压缩域上进行 ,不需迭代 ,具较强实时性。文中阐述了方法的基本思想、理论依据与实现 ,实验表明 :该方法具有很好的效果  相似文献   

17.
在智能交通系统的拍摄场景中,由于车辆间距过近和摄像角度原因,引起车辆遮挡的现象,增加了目标车辆检测和跟踪的难度。根据轮廓特征点,结合轮廓凹凸性,提出一种凹陷区域检测与分割算法。首先采用背景差分法提取车辆区域,根据车辆区域外接矩形的长宽比和占空比判断是否是多车遮挡,同时通过凸包分析算法提取遮挡凹陷区域;然后通过Freeman链码确定凹陷区域的轮廓特征点,对特征点进行凹性分析;最后匹配分割点,采用Bresenham直线生成法分割遮挡车辆。实验结果表明,该算法有效解决遮挡车辆分割不准确问题,与其他算法相比,具有较好的场景适应性。  相似文献   

18.
针对传统二维最大熵阈值分割算法关于二维直方图的区域划分中存在的缺点(即图像的部分目标点和背景点错误划分为边缘点或噪声点,而把部分边缘点和噪声点划分为目标点和背景点)以及搜索最佳阈值向量的时间复杂度较高的缺点,提出了采用视觉模型构造二维直方图,并提出了一种二维直方图的新的区域划分方法,同时还提出了基于视觉模型的二维最大熵阈值分割算法,提出的阈值分割算法降低了计算复杂度的同时还具有很好的分割性能。根据一些图像分割的定量评价标准,做了一系列实验,与几种典型的二维阈值分割算法相比,提出算法的分割效果更好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号