首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
基于支持向量机的小波域视频字幕检测与提取   总被引:2,自引:0,他引:2  
视频流里的文本字幕包含了丰富的语义信息,对于视频内容的理解、索引和检索具有重要的作用.文中首先对视频图像进行分割,提取它们在小波变换域中的统计特征,然后用支持向量机(SVM)分类器对这些特征进行分类,实现了字幕的自动检测与提取.仿真结果表明该方法具有较好的适用性.  相似文献   

2.
为提高焊缝超声波探伤的实时跟踪,提出将图像分割方法应用于白线跟踪法和激光跟踪法两种不同焊缝跟踪系统中。一种是采用Hough变换边缘检测法对检测图像中的目标边缘进行提取,另一种是利用区域增长法对检测图像中的目标区域和背景区域进行有效区分,这两种方法都能很好地提取出图像中的目标特征信息。仿真结果表明,两种图像分割算法在焊缝跟踪过程中能够准确地识别出焊缝的特征信息,确保跟踪系统的实时性。  相似文献   

3.
文本图像页面分割算法研究   总被引:1,自引:0,他引:1  
提出了一种基于改进纹理谱的文本页面分割算法,该算法首先采用改进的递归投影轮廓切割算法对文本图像页面进行粗分割,并提取文本图像的纹理谱特征;然后采用最小距离法将相邻纹理单元进行分类;最后实现文本图像页面文字区与非文字区的精确分割.实验表明,提出的方法在含有文字、图、表格的文本图像页面分割中效果很好,对其他复杂文本图像页面分割也具有适应性.  相似文献   

4.
基于内容的视频多模式检索方法   总被引:1,自引:0,他引:1  
在视频数据的检索方法方面,采用单一媒体的处理技术比较多,基于视频数据所表现的内容语义进行检索的提案很少,而且能够将视频数据与其相关的其他形式的数据整合并高效利用,保障视频数据在安全、高效的网络下进行多模式检索的研究也不多见。在检索方法上从解决这个问题入手,提出了多模式的视频特征提取与检索方法。该方法从视频语义特征的角度构建视频数据的语义特征库,将与视频语义相关的声音、字幕、音乐、剧情脚本、新闻文稿等信息特征进行整合,以人像、字幕、语音、视频镜头识别和剧情脚本分析的组合技术,利用语音相关性测定、选择字幕帧,边缘提取、字幕区域二值化和小波包分解、核函数技术等方法从语音、视频中提取语义特征,建立视频数据语义特征的多模式提取和检索模型。  相似文献   

5.
提出一种基于边缘强度的视频图像字幕提取算法。此算法通过对图像进行锐化预处理,使得对特定的视频序列可以达到较好的提取效果;通过领域平均处理,更好地分离了字幕区域和背景区域;提出一个基于投影统计特征分析的算法,能够更好、更高效、更精确地分离和提取字幕。实验证明,该算法在效果上优于其他的算法,并且该算法复杂度低,实用价值高,可以广泛用于视频编解码等过程中。  相似文献   

6.
一种新的视频字幕提取算法   总被引:1,自引:0,他引:1  
提出一种基于边缘强度的视频图像字幕提取算法。此算法通过对图像进行锐化预处理, 使得对特定的视频序列可以达到较好的提取效果; 通过领域平均处理, 更好地分离了字幕区域和背景区域; 提出一个基于投影统计特征分析的算法, 能够更好、更高效、更精确地分离和提取字幕。实验证明, 该算法在效果上优于其他的算法, 并且该算法复杂度低, 实用价值高, 可以广泛用于视频编解码等过程中。  相似文献   

7.
为了提取显示器的显示数据,提出一种自动提取视频中显示区域的方法,该方法利用多帧视频图像信息,根据录取的视频图像的特点,采用帧间差分方法,分割出显示区域。然后,针对由于摄像头和显示器刷新率不同带来的阴影问题,采用一种保持对比度的灰度变换方法,消除了阴影的影响,同时增强了视频信息,为后续的图像处理扫清了障碍。  相似文献   

8.
面向自主机器人的实时彩色视觉系统   总被引:4,自引:0,他引:4  
设计开发了一种新型的机器人实时彩色视觉系统,以及基于颜色的实时分割和识别软件系统,采用即插即用型的USB接口数字摄像头,简化了系统的使用和维护,首先把输入的彩色图像从RGB空间转换到YIQ颜色空间,提取出和颜色有关的IQ平面的信息;然后根据目标颜色在IQ平面里分割图像,再对图像进行游程编码,并从游程编码中提取出有效的图像信息;最后通过TCP/IP接口将视觉信息发送给机器人控制系统,为了抑制光强变化的影响,采用了一种阈值学习方法,实验结果表明,整套系统具有很高的实时性和较好的识别效果。  相似文献   

9.
为有效组织和浏览新闻视频,提出了一种基于边界归类的新闻视频故事分割算法.该算法视镜头边界为候选故事边界,并定义新闻基本处理单元划分新闻视频.算法分为新闻基本处理单元的获取和新闻基本处理单元分析两部分.前者采用镜头分割和镜头标定对原始视频进行合理划分,获取基本处理单元边界,有效缩小故事边界判定范围;后者对基本处理单元内的字幕文本进行分析,实现了字幕文本分类和主题字幕相似性比较,并结合静音特征,从音视频两方面判定故事边界,得到最终的分割结果.实验结果表明,该算法能有效描述新闻故事边界,准确分割新闻故事单元,实现对新闻视频的语义划分,为新闻视频检索、导航等应用提供前期辅助.  相似文献   

10.
为了建立基于视频行为识别的长时程图像序列的时空信息模型,文章提出了一种嵌入注意力的时空特征融合网络(attention-embedded spatial-temporal feature fusion network, ASTFFN)的深度神经网络模型。ASTFFN将一个包含动作的长时程图像序列分割成多个重叠的片段,并使用一个注意力嵌入特征提取网络(attention-embedded feature extraction network, AFEN)从每个片段中的RGB图像或光流图像中提取经过注意力加权的时空特征,进而融合每个片段的时空加权特征,生成行为识别的视频级预测。基于UCF101和HMDB51行为识别数据库进行了大量的实验,验证了方法的有效性。与目前主流的行为识别算法相比,该文方法在识别精度上取得了较好的效果。  相似文献   

11.
基于线条识别的扫描工程图字线分割方法   总被引:1,自引:1,他引:0  
在扫描工程图矢量化中,文字位图与图形位图分割的问题一直被广泛关注,许多现有方法根据连通区的形态特征和空间分布来分割文字和图形的位图,然后分别识别,其处理能力都局限在无粘连情况下,无法处理字线粘连及相交的情况,且难以区分尺寸范围相近或形态相似的文字与图形,提出一种基于线条识别的文字/图形分割方法,通过准确地识别线条并抽取其位图来分离文字,不仅保证了分割的正确性,而且为文字位图的字串的组织给出了依据。  相似文献   

12.
一种基于先验知识约束的车牌字符分割新算法   总被引:1,自引:0,他引:1  
车牌字符分割是车牌自动识别系统的三大核心技术之一,字符分割是字符识别的基础;针对传统的基于连通域分割字符算法计算量大、处理时间长的不足之处,在此提出了一种改进的算法,充分利用先验知识进行字符粗分割,在此基础上再利用连通域法最终实现字符完整分割,同时利用先验知识改进了传统的迭代法求二值化阈值算法,减少了迭代次数;实验表明:在此提出的字符分割算法在准确提取了车牌字符的前提下,大大缩短了处理时间,满足了实时性要求。  相似文献   

13.
基于核心密度估计的动态目标分割改进模型   总被引:3,自引:0,他引:3  
数字视频中的动态目标分割是基于计算机视觉技术的分析、识别系统中关键的处理步骤,分割结果的正确率决定了后期分析或识别过程的质量.在数字视频中存在各种有害动态像素,它们会降低分割过程的正确率.动态目标的阴影是这些有害像素的一种,因为它们本身不属于动态目标形状信息的范畴,但分割过程却能很容易将它们作为有效的动态目标像素分割出来.最近有关动态目标分割的研究提出了基于核心密度估计模型的分割方法.基于RGB颜色空间的核心密度估计模型能够在彩色视频中抑制阴影,但是对于灰度视频这种模型是无法抑制阴影的.作者针对上述局限提出了一种基于像素边缘测量的核心密度估计模型,用于动态目标分割,能够在彩色和灰度视频中抑制阴影.实验结果证明,这种新模型在通常的应用条件下是有效的.  相似文献   

14.
为了对视频内容进行语义级别的事件分析和索引 ,进一步满足用户访问大规模体育视频库的需求 ,提出一种 3层次的视频语义推理方案。在最底层 ,提取视频特征 ,并提出一种视频语义片段自动分割算法 ;在第二层 ,把各语义片段映射到语义概念 ;在最高层 ,建立视频语义事件的有限状态自动机模型 ,进行事件推理和识别。实验结果表明 ,该方案可以有效地进行视频事件识别 ,检测的精度和速度都可以得到很好的保证  相似文献   

15.
基于图像处理的烟叶叶片结构分类算法   总被引:2,自引:0,他引:2  
针对采用传统工艺方法进行烟叶叶片结构检测和分类的缺点,介绍了图像处理和分析技术在烟叶叶片结构分类识别中的应用,讨论彩色图像分割、连通区域标记、面积的检测、识别和分类等主要的图像处理算法,提出一种动态的烟叶叶片面积大小分类的算法,它是基于类的分离度思想而提出的.该算法对于不同品质的烟叶图像具有自适应性,且计算准确、速度快,能满足实时性要求.此算法已有效地应用于烟叶叶片结构自动分类系统,并取得了令人满意的效果.  相似文献   

16.
自然场景文本识别是计算机视觉领域一项极具挑战性的任务,为此提出一种适用于任意方向的自然场景文本识别算法.使用高分辨分割网络作为基础框架提取文本的空间信息,利用卷积长短时记忆网络提取文本的时空序列信息,同时通过设计字符注意机制使模型专注于字符上,并采用可微分二值化函数进一步加大网络对前景的注意力,削弱对背景区域的关注,网...  相似文献   

17.
提出了一种在图割框架下自动实时的前景目标提取算法.通过混合高斯背景建模与基于颜色和局部表观的阴影判别相融合的方法,设置能量函数的数据项,并基于局部二值模型算子构建能量函数的平滑项.利用动态的图割算法,求取目标函数极值,实现视频目标的自动提取.在不同视频上对提出的分割算法进行性能测试,结果表明算法具有较好的分割性能且计算复杂度较低.  相似文献   

18.
开发了用于自动导引车辆的数字工位视觉识别系统.根据路面区域、导航线区域和数字工位区域的不同颜色特征,以彩色图像中的R分量(红色分量)为处理对象,利用红色分量在每一副采集图片的像素分布中寻找字符可能出现的区域;根据HIS颜色空间特征参数饱和度S和色调H,提取数字工位;快速校正后,利用字符的整体结构特征进行数字初步分类,优化字符特征区域的确定及统计办法,在改进的特征统计基础上进行数字的再辨识.现场实验表明,该系统可获得较好的识别效果(正确率达到98%),字符提取耗时16 ms,校正、识别总耗时47 ms,满足车辆数字工位识别实时性、准确性、鲁棒性的要求.  相似文献   

19.
图像阈值分割技术在图像分析和图像识别中具有重要的意义,最大熵方法具有很多优点,但同时也存在弱点:需要大量的运算时间,因此需要引入优化算法,文中将遗传算法用于最大熵阈值的图像分割方法中,提出了一种基于遗传算法的最大熵阈值图像分割方法。仿真实验表明,该方法可以有效地提高最大熵图像分割的计算速度,提高图像处理的实时性。  相似文献   

20.
贾运  田学东  左丽娜 《科学技术与工程》2020,20(29):12021-12027
古籍版面图像结构复杂,对其进行有效、准确的分析是实现古籍汉字识别与检索的前提和基础。对古籍汉字版面分析的关键问题展开研究,在对古籍版面特点进行分析与归纳的基础上,提出基于LOF和波动阈值的古籍版面分析方法。首先,采用基于LOF的分类算法对古籍版面图像投影分割后的区域进行分类,确定存在分割问题的候选混合区域;然后,利用波动阈值对候选混合区域中的文字与框线粘连部分进行分割;最后,确定古籍版面中的文字区域并输出。实验结果表明,该算法能够有效地分离古籍文字区域和框线区域,版面分类和分割准确率分别为87.02%和78.69%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号