首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 281 毫秒
1.
视频文字检测与多尺度定位算法   总被引:4,自引:1,他引:3  
视频文字识别(video optical character recognition, Video-OCR)的关键环节是视频文字检测.该文提出一套文字检测与定位算法,综合应用文字的梯度、纹理和时序特性,其核心技术是一种基于支持向量机(support vector machine, SVM)分类器的多尺度定位算法.用闭包矩形检测技术作为预检测限制SVM的搜索范围; 时序优化利用时序特性排除部分偶然误检.实验表明 该检测算法与同类算法相比在命中率和误检率上最多分别超出21%和57%.综合利用多种文字特性不仅加强相互限制,降低计算量,而且获得更佳检测性能.  相似文献   

2.
提出了一种基于彩色边缘检测、形态学和逻辑与运算的视频文字提取方法,首先,分别运用垂直、水平、对角三个方向的彩色边缘检测算子提取出原图的边缘图像,然后分别对上述三幅边缘图像进行数学形态学运算,得到三幅不同方向的连通域图。最后,将这三幅连通域图相与,消除无用的信息,得到最终的文字区域。实验证明,该方法具有高的文字提取率和好的鲁棒性。  相似文献   

3.
图像中文字信息的提取和识别具有极大的应用价值,文字定位是文字提取最关键的步骤之一.现有文字定位算法复杂度高,查全率和查准率都有待提高.本文提出一种基于频域纹理特征的图像文字定位方法.在图像频域提取纹理特征后初步定位文字区域,再根据文字区域的几何属性得到最后的定位结果.实验结果证明,该方法在粗定位和精确定位阶段均能取得较好的效果,且计算复杂度较低.  相似文献   

4.
针对新闻视频中的文字区域检测定位问题,研究了如何快速有效地检测新闻视频中的文字区域,用以实现自动视频检索。为克服视频中文字大小不一的难题,根据视频图像中文字区域特征有别于背景区域的特点,提出了一种基于多尺度图像融合的新闻视频文字区域检测定位算法。算法主要采用训练和学习两个步骤,首先对人为收集的含字符样本与不含字符样本进行小波特征和局部二值模式等特征提取,并完成SVM分类器训练,获取分类器;然后对测试视频帧进行多尺度的遍历检测,并融合检测结果,获取每帧的文字区域。实验结果表明,与前人提出的基于边缘检测的方法相比,算法具有明显优越性,在定位准确度上有较大提高,同时还能克服视频帧之间的快速变换,具有一定的实用意义。  相似文献   

5.
闪光灯和标题条对新闻视频镜头检测影响的研究   总被引:1,自引:0,他引:1  
新闻视频中特有地存在着大量闪光灯事件和后期视频编辑时加入的标题条事件,对镜头检测带来很大干扰。开发了一种建立在统计学基础上的稳健帧间差度量算法,克服标题条的突然出现和消失等局部剧烈运动对镜头切分的影响。根据闪光灯在视频流时序上的特征,提出通过对潜在切变位置前后视频内容的再检测来区分闪光灯事件和切变。该方法具有通用性和实时性,可以在视频自动分析或自动索引系统中得到实际应用。  相似文献   

6.
为了有效利用非文字音频事件进行会话语音的语义分析,在分析口语中频繁出现的音频事件特征差异的基础上,提出了一种基于两步判决的口语中非文字音频事件的检测方法.该方法利用音频事件的信号特征构造音频事件信号段,采用门限判决来检测长掌声(第一步判决),而用统计模型来检测其它音频事件(第二步判决).实验结果表明:该方法检测填音、笑...  相似文献   

7.
本文针对视频序列文字的检测与提取技术做了详尽的分析和讨论,内容包括:文字事件的检测、帧图像中文字区域的检测与定位。首先进行文字事件检测,然后进行边缘检测,加强了检测到的文字的边缘;对边缘进行尺寸限制过滤掉了不符合文字尺寸的边缘;进一步,提出像素密度8的概念,并指出文字区域的像素密度δ应在某一阚值范围之内(δmin〈δ〈δmax)。通过像素密度δ滤去了非文字区域,应用投影法最终确定视频字幕所在区域。  相似文献   

8.
在基于文本的视频检索和推荐系统中,视频标题是描述视频内容的必不可少的一个信息来源.然而,人们对视频标题本身的描述能力并没有进行深入的研究.文中根据标题对视频内容的刻画程度将标题的描述能力分为可描述、可理解不可描述和不可理解3个等级,并把标题描述能力的评估问题作为分类问题来处理.鉴于支持向量机( SVM)对小样本分类问题...  相似文献   

9.
信息时代,民族文字信息处理对加速民族地区信息社会化进程,促进民族地区社会进步发挥了重要的作用.在信息文明强烈冲击下,探讨民族文字信息处理技术发展现状,提出促进民族文字信息处理发展的对策,具有独特的现实意义和研究价值,值得我们去审视和思考.本文简要介绍民族文字信息处理发展情况,分析了民族文字信息处理发展中出现的各种问题,对促进民族文字信息处理发展提出了几点对策.  相似文献   

10.
由于视频信息信息量大,内容丰富,使得对其进行有效的管理和检索成为一个困难而又必须解决的课题.在对视频分割算法进行研究的同时,提出一种基于语义的视频镜头检测方法.主要是通过相邻帧之间的差异来判断是否存在镜头切换出现.实验验证该方法是可行的.  相似文献   

11.
一种新的视频字幕提取算法   总被引:1,自引:0,他引:1  
提出一种基于边缘强度的视频图像字幕提取算法。此算法通过对图像进行锐化预处理, 使得对特定的视频序列可以达到较好的提取效果; 通过领域平均处理, 更好地分离了字幕区域和背景区域; 提出一个基于投影统计特征分析的算法, 能够更好、更高效、更精确地分离和提取字幕。实验证明, 该算法在效果上优于其他的算法, 并且该算法复杂度低, 实用价值高, 可以广泛用于视频编解码等过程中。  相似文献   

12.
An efficient method to recognize caption area in MPEG compressed video was presented, by making use of the contrast of l-frame to distinguish caption area with background. We define texture energy, intensity of boundary. distance of background, and texture correlation to recognize caption area and caption frame. The benefit of only analyzing l-frame is that we can make use of DCT coefficients directly without losing information. We have experimented with our algorithm, and the result of experiment indicates that the performance of the algorithm is efficient.  相似文献   

13.
基于上下文信息的新闻故事单元分割   总被引:1,自引:0,他引:1  
为了有效检索和管理新闻视频资源,提出了一种利用多模态特征、基于上下文信息的新闻故事单元分割方法。首先利用字幕变化、音频类型和视频镜头类型信息将新闻镜头序列转换成为相应的关键词序列,使新闻故事单元分割转换成为文体序列分割的问题;然后应用一种有效的序列分割模型—条件随机场,来分割新闻故事单元。对多段视频的测试结果证明了该方法的有效性,取得了查全率为72.9%、查准率为88.4%的较好结果。  相似文献   

14.
就字幕在教学电视中的应用,结合实例从字幕与图象、声音等其它电视要素之间的关系,字幕在电视中的功能以及字幕的设计原则等方面作了分析和讨论  相似文献   

15.
镜头边界检测是基于内容视频检索的基础环节。由于视频类型与内容众多,目前镜头边界检测中存在阈值选取困难、查全率和查准率不高等问题。针对以上问题提出一种改进的基于互信息量的镜头边界检测算法,在字幕检测定位算法有效定位字幕区域的基础上,通过比较非字幕、非四角区域HSV空间直方图求取的相邻帧间互信息量的差异程度,实现镜头边界检测。实验表明,与当前应用最广泛且比较有效的双阈值算法相比,突变镜头检测综合性能平均提高12.4%,渐变镜头检测综合性能平均提高8.2%,通过自适应阈值的选取,有效解决了阈值依赖人工经验选取的问题;与当前已提出的基于互信息量的镜头边界检测算法相比,该算法降低了计算复杂度、几乎能检测所有的淡入淡出镜头边界,并使得镜头边界检测具有较高的查全率与查准率。  相似文献   

16.
研究了独立成分分析法(ICA)在视频序列处理中的应用,提出了一种新的基于ICA算法的视频字幕检测与定位方法,该算法采用了小波变换来提取独立分量.仿真实验结果表明,与传统方法相比,该方法能够有效消除背景信息,提高字幕定位的精度,具有更强的鲁棒性.  相似文献   

17.
基于视频区域特征及HMM的体育视频分类研究   总被引:1,自引:0,他引:1  
提出了一种基于视频区域特征的体育视频分类方法.首先将帧分块,对块亮度均值大小进行比较得到块亮度比较编码信息BICC,以及对视频帧各块的颜色分量进行统计得到块颜色直方图;再利用这些特征通过SVM对体育视频进行分类;最后利用一阶HMM对SVM的输出结果进行后处理,得到视频的最终分类结果.实验结果表明,方法对于体育视频分类的效果较好.  相似文献   

18.
在视频压缩领域,帧间预测技术占有十分重要的地位。在简要介绍两种帧间运动估计/补偿模式基础上,该文重点讨论了局部运动估计中块匹配算法的应用和Sprite编码中的全局运动估计算法,提出一种"改进的分级块匹配法",并结合Sprite编码实现序列图像帧间压缩。大量实验表明,采用这种局部和全局相结合的预测算法,可以减少搜索时间,提高图像压缩质量和压缩比,是视频压缩可以输出甚低码流的有效手段之一。  相似文献   

19.
A novel method was proposed,which extracted video object' s track and analyzed video object's be-havior.Firstly,this method tracked the video object based on motion history image,and obtained the co-ordinate-based track sequence and orientation-based track sequence of the video object.Then the pro-posed hidden markov model(HMM)based algorithm was used to analyze the behavior of video object withthe track sequence as input.Experimental results on traffic object show that this method can achieve thestatis...  相似文献   

20.
为了有效抑制噪声干扰,将数字通信模型引入到体全息视频存储方案设计中。并且,针对体全息存贮系统中复杂噪声特点,提出了新的数字信号处理方法,包括二维渐进循环移位交织器、调制.阵列码的编译码方法其相应的软判决度量方法等,旨在有效地抑制体全息系统中的噪声干扰。实验结果表明,研究达到了预期目的,真实视频数据的全息存储取得了成功。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号