首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 765 毫秒
1.
针对广告的两个基本特征: 镜头切换较频繁和经常突显商标信息, 提出一种基于镜头切换和文本检测的广告检测算法. 该算法先对各相邻帧进行直方图差分, 再对剪切、 消融、 淡入淡出和划变4种常见的镜头切换方式进行分析和识别, 实现了镜头切换检测. 对于镜头切换频率较低的广告, 通过基于最大梯度差分的文本检测方法检测广告商标信息, 实现了广告自动检测系统. 实验结果表明, 对于约15 min的视频序列, 该检测算法可获得83.32%的正确率, 可初步满足广告检测的要求.  相似文献   

2.
一种在图像和视频帧中检测文本的新方法   总被引:1,自引:1,他引:0  
提出了一种在带有复杂背景的图像和视频帧中检测文本的由粗到细的新方法.首先用连通分量(Component Connect,CC)方法对可能是文本的区域进行粗定位,然后再进行纹理分析,得到特征向量后,用统计图的方法对其进行筛选,并对筛选后的特征向量使用BP神经网络进行分类,从而得到真正的文本区域.经过测试,提出的算法在图像和视频帧中的检测率达到95.3%.  相似文献   

3.
钮燕 《科技信息》2011,(29):I0305-I0307
广告视频中的文本定位是视频广告探测系统的一部分,为了能够更加精确地定位出广告的边界位置,可以在视频广告探测系统中引入文本信息作为一种判断的依据。文章对原有的基于边缘特征多次投影分析的文本定位方法进行改进,提出了一种基于多分辨率的广告视频文本定位算法,实验表明该算法对于广告文本的定位效果较好,并为广告边界位置的定位提供了辅助信息。  相似文献   

4.
一种基于机器学习的视频镜头边界检测方法   总被引:2,自引:0,他引:2  
镜头边界检测是基于内容视频检索中的第一步,在视频分析中扮演着重要角色。在此基于统一的机器学习框架,提出一种新颖的模式分类方法来解决新闻和广告视频中镜头检测问题。该方法利用支持向量机将镜头分为无场景变化、切变以及大场景变化;在大场景变化中,进行快速运动和渐变的分类。同时研究了以往同类工作中所忽视的不平衡样本分类问题。实验结果表明该方法能有效检测出新闻和广告视频中的镜头转换。  相似文献   

5.
针对复杂背景中过多的边缘信息与噪声干扰引起笔画宽度检测不准确的问题,提出了一种结合纹理背景抑制的笔画宽度变换文本检测方法.采用Butterworth高通并结合文本纹理特征,实现了在抑制背景的同时有效保留文本区域的信息.通过结合利用加权引导滤波的图像增强技术降低噪声对边缘检测的干扰,使得文本图像的笔画宽度与边缘梯度信息的提取更为准确,从而有效提升了笔画宽度变换文本检测的性能.基于ICDAR数据库的实验结果也验证了该方法的有效性.  相似文献   

6.
半监督学习是机器学习近年来的热点研究方向,而协同训练(Co-training)则是半监督学习中的重要范式,它利用双视图训练两个分类器来互相标记样本以扩大训练集,以此借助未标记样本提升学习性能.在实际应用中,视图通常会受到属性退化和噪声的影响而变得不充分(即视图不能提供足够的信息来正确预测样本的标记).在不充分视图下,两个视图上的最优分类器变得不再兼容,一个视图中的分类器标记的样本可能不利于另一个视图学得最优分类器.针对这一问题,提出一种改进的协同训练算法Compatible Co-training,它记录学习过程中每个未标记样本被赋予的标记,通过比较更新后的分类器对样本预测的标记与其初始标记,动态地删除标记不一致的样本,从而除去不利于学得最优分类器的样本.实验结果显示出Compatible Co-training比协同训练具有更好的泛化能力和更快的收敛速度.  相似文献   

7.
提出一种基于多种文本类型的半监督性别分类方法,即根据微博平台中用户所产生的不同类型的文本(如:原创微博、转发微博等)对用户的进行性别分类。文中的方法是一种基于协同训练(Co-training)的半监督学习方法,旨在减少分类器对大量标注样本的依赖。首先将不同类型的文本分为不同的独立视图;其次,在每个视图中利用LSTM分类器挑选置信度最高的未标注样本;最后,将挑选出来的未标注样本加入训练模型迭代训练。实验结果表明我们的方法能够有效利用非标注样本信息,并明显优于其他现有的半监督性别分类方法。  相似文献   

8.
近年来场景文本检测技术飞速发展,提出一种可适用于任意形状文本检测的新颖算法Mask Text Detector.该算法在Mask R-CNN的基础上,用anchor-free的方法替代了原本的RPN层生成建议框,减少了超参、模型参数和计算量.还提出LQCS(Localization Quality and Classification Score)joint regression,能够将坐标质量和类别分数关联到一起,消除预测阶段不一致的问题.为了让网络区分复杂样本,结合传统的边缘检测算法提出Socle-Mask分支生成分割掩码.该模块在水平和垂直方向上分区别提取纹理特征,并加入通道自注意力机制,让网络自主选择通道特征.我们在三个具有挑战性的数据集(Total-Text、CTW1500和ICDAR2015)中进行了广泛的实验,验证了该算法具有很好的文本检测性能.  相似文献   

9.
针对单特征辨识度较低问题,基于多特征的AdaBoost行人检测算法,提出一种融合灰度和轮廓信息的新的多特征综合表示方法.该方法通过统计样本的权重直方图建立分类模型,并用多个直方图的乘积表示样本在多特征下对应的联合概率分布,从而基于多特征联合概率更精准地描述行人,提高行人检测的鲁棒性.实验结果表明,改进后的基于多特征行人检测算法提高了行人检测精度、降低了误检率,目标识别的置信度明显提高,在多变的自然背景下可以取得较好的效果.  相似文献   

10.
为解决当前视频运动目标检测中检测精度不高以及视频颜色失真对运动目标检测的干扰问题,该文提出了一种改进的视频运动目标检测方法.比较了多种颜色空间下的运动目标检测算法,通过对视频的RGB(Red Green Blue)颜色空间建模,根据实际情况,对不同的颜色分量赋予不同的权值,提高了该颜色空间的真实性.同时,创新性地将神经网络与颜色空间结合,通过自组织映射,实现了对视频流数据中的运动目标检测.大量的实验结果表明,该方法对提高视频运动目标检测准确率有着显著的效果.  相似文献   

11.
基于边缘特征分析和线性判断的文本帧检测算法   总被引:1,自引:1,他引:0  
为保证视频文本检测作用于含有文本的视频帧中,提出一种基于边缘特征和分量线性的文本帧检测算法。算法首先去除模糊视频帧,通过融合颜色和梯度信息以及文本聚类的方法得到边缘图,利用启发式规则滤除非文本分量;然后根据视频文本分量质心位置及最小外接矩形大小规律构建候选文本行;并结合文本行内字符结构特征定义线性关系。最后对候选文本行进行线性判断,若有候选文本行符合线性关系则将视频帧标记为文本帧。实验结果表明所提文本帧检测算法比其他类似算法检测性能更好。  相似文献   

12.
有些文本缺少字符集信息,因而阻碍了字符信息的正确解析.为了获得字符集信息可以根据文本中字符信息的统计特征以及各种字符集之同的差异来识别出文本的字符集.集成的字符集检测方法通过综合应用编码模式检测方法、字符分布方法和双字符序列检测方法来检测字符集.它根据算法复杂度和每种算法的准确率来调度算法.使得在用一种方法不能确定字符集的情况下利用其它方法来检测出字符集实验结果表明:集成的字符检测技术具有较高的准确率.集成的字符检测方法在某些情况下通过适度增加一些时间来获得较高的精度.  相似文献   

13.
根据广播广告监测的需求,提出一种基于重叠式元胞移位的音频广告检测算法.由于广告类型的多样性,该算法以多种类型的广告作为研究对象,并结合元胞自动机的基本理论和音频本身所具有的特点,采用重叠式元胞移位与互相关函数相结合的检测算法,实现音频广告的检测.实验结果表明:基于重叠式元胞移位的音频广告检测算法可以快速准确地从音频广播节目中检测出广告所在时间段,统计得到广告出现的次数,具有很好的鲁棒性.  相似文献   

14.
高效和准确的场景文本(efficient and accuracy scene text,EAST)检测算法速度快且结构简单,但是由于文本结构的特殊性,导致在检测中尺寸较小的文本会被遗漏,而较长的文本则完整性较差.针对EAST算法存在的问题提出一种新的自然场景文本检测模型.该方法利用自动架构搜索的特征金字塔网络(neural architecture search feature pyramid network,NAS-FPN)设计搜索空间,覆盖所有可能的跨尺度连接提取自然场景图像特征.针对输出层进行修改,一方面通过广义交并比(generalized intersection over union,GIOU)作为指标提升边界框的回归效果;另一方面通过对损失函数进行修改解决类别失衡问题.输出场景图像中任意方向的文本区域检测框.该方法在ICDAR2013和ICDAR2015数据集上都取得了较好的检测结果,与其他文本检测方法相比,检测效果也得到了明显提升.  相似文献   

15.
提出一种基于过渡像素的视频流人工文本检测与定位算法.该算法在水平和垂直方向上提取过渡像素点,生成过渡图.通过块滤波器抑制背景的过渡像素,采用基于密度的快速区域生长算法形成候选文本区域;再利用改进的局部二进制模型(LBP)验证候选文本区.仿真实验结果表明,本文的改进算法相对于Kim算法,字符定位的准确率更高.  相似文献   

16.
A schema for content-based analysis of broadcast news video is presented. First, we separate commercials from news using audiovisual features. Then, we automatically organize news programs into a content hierarchy at various levels of abstraction via effective integration of video, audio, and text data available from the news programs. Based on these news video structure and content analysis technologies, a TV news video Library is generated, from which users can retrieve definite news story according to their demands. Foundation item: Supported by the Science Item of National Power Company (No. SPKJ 016-071) Biography: Yu Jun-qing (1975-), male, Ph. D candidate, research interests: scientific visualization and video database.  相似文献   

17.
针对复杂场景的视频,在传统的梯度检测算法基础上融入多尺度技术,提出一种由粗到细的两阶段视频字符文本检测新算法.首先,利用加权平均梯度能量特征和运动能量特征对采样帧粗检测,形成候选文本区;然后,通过连通域分析,过滤部分虚检的候选文本区,再利用梯度方向的统计特征进行验证,得到精确的检测结果.仿真结果表明,本方法在处理复杂背景视频图片时具有较好的鲁棒性.  相似文献   

18.
基于聚类的垃圾邮件识别技术研究   总被引:1,自引:0,他引:1  
随着垃圾邮件数量日益攀升,如何有效识别垃圾邮件已成为一项非常重要的课题。为克服k最近邻(k-nea-rest neighbor,kNN)分类法在垃圾邮件识别中的缺陷,本文基于聚类算法提出了一种改进kNN识别方法。首先使用基于最小距离原则的一趟聚类算法将训练邮件集合划分为大小几乎相同的超球体,每个超球体包含一个类别或多个类别的文本;其次,采用投票机制对得到的聚类结果进行簇标识,即以簇中最多文本的类别作为簇的类别,得到的识别模型由具有标识的簇组成;最后,结合最近邻分类思想,对输入的邮件进行自动识别。实验结果表明,该方法可大幅度地降低邮件相似度的计算量,较TiMBL、Nave Bayesian、Stacking等算法效果要好。同时,该方法是一种可增量式更新识别模型的方法,具有一定的实用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号