首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
针对篮球视频中运动员的检测识别问题,提出一种基于AdaBoost分类器的检测方法 .首先,从视频中获取有用帧,并通过SampleCreator软件来标记运动员,提取出全身和上半身矩形图像.然后,基于积分图技术从对象图像中提取Haar特征.接着,利用AdaBoost算法选择出具有较强分类性能的特征,训练一系列的弱分类器,并将其进行级联来构建最终的强分类器.最后,通过强分类器对Haar特征进行判别,从而检测图像中的运动员.实验结果表明,该方法能够准确检测并识别视频中的运动员.  相似文献   

2.
针对网球视频中网球的检测和跟踪问题,提出了一种基于最优路径森林(OPF)聚类的球体跟踪方案.首先,对输入的不稳定视频进行稳定化处理,以消除视频中的抖动和噪声.然后,将黄色平面强度特征和相位四元数傅里叶变换特征作为球体特征,从视频帧中分离出候选目标.最后,利用OPF聚类从球体候选目标中分类出真实目标,获得球体实际位置,从而绘制出球体运动轨迹.实验结果表明,该方法能够从视频帧中准确检测出网球,具有较高的精度和鲁棒性.  相似文献   

3.
基于深度学习的车检图像多目标检测与识别   总被引:1,自引:0,他引:1  
为了实现快速和自动的车辆外观检测,提出一种基于深度学习的车检图像多目标检测与识别方法。首先,采用轻量级神经网络YOLOv3实现车检图像中车头、轮胎、车牌及三角形标志的检测与识别;其次,采用多任务级联卷积神经网络实现车牌4个关键点定位;再次,利用车牌4个关键点坐标,结合目标车牌图像高宽先验,通过透视变换对车牌进行校正;最后,设计卷积神经网络实现车牌底色分类,同时设计卷积循环神经网络,实现车牌字符识别。实验结果表明,在816×612的车检图像上,该方法中端到端的多目标检测与识别的平均精度达98.03%;为便于在车检场景下应用该模型,利用阿里巴巴推理引擎将模型部署到CPU端,使多目标检测与识别的平均速度达10帧/s,从而满足车检的应用需求。  相似文献   

4.
为避免人为因素对人脸面部图像皮肤纹理特征提取产生的影响,用卷积神经网络算法对人脸图像修饰进行检测.传统的图像分类方法需要进行复杂的人工特征提取,而卷积神经网络可以自动学习并直接从图像中获取特征,解决了传统模式识别方法特征提取难的问题,具有更高的识别率和更广泛的实用性.在传统卷积神经网络模型中,调整卷积核大小、减少参数、改变卷积层滤波器数量、调整卷积层和池化层的交替方式、使用dropout来提高模型泛化能力以形成适用于人脸修饰检测的新的网络模型.实验结果表明,在引入的数据集上,新的网络模型对人脸图像的修饰检测有较强的鲁棒性,达到了较高的识别率.  相似文献   

5.
针对图像的超分辨率重建问题,提出一种基于稀疏表示和块匹配的重建方法.首先,根据图像退化模型将HR图像退化成LR图像.然后,通过训练获得过完备字典,对图像重建问题进行稀疏表示,并对此进行求解.最后,利用重叠块技术缓解块效应,利用反向投影技术保证全局一致性,最终获得重建的HR图像.另外,将该方法扩展到多帧图像重建中,利用块匹配技术从多帧图像中选择出一个目标图像,以此实现重建.实验结果表明,该方法的重建图像具有较低的峰值信噪比.  相似文献   

6.
本文针对同源视频的复制-粘贴篡改方式,提出了一种基于颜色特征的视频篡改检测方法,能够定位篡改位置并修复原视频.首先,计算各帧的颜色直方图,提取颜色特征并字典排序,计算邻近帧的帧间相似度获得匹配帧对;其次,针对全局颜色直方图不能表示颜色的空间分布信息,提取匹配帧对的彩色边缘特征进行复检;最后利用SIFT特征点的匹配精确定位篡改位置,并恢复原视频.实验表明,本文提供的方法在SULFA数据库视频检测上具有100%的准确率和召回率.  相似文献   

7.
针对SAR图像中显著性目标检测问题,提出一种基于多尺度自卷积方差显著性的自适应检测算法. 该算法在对SAR图像多尺度自卷积运算基础上,通过计算MSAV得到方差显著图. 设计了一种自适应阈值检测器,完成SAR图像中显著性目标的检测. 实验结果表明,在复杂背景环境下,所提算法能有效检测出与人类视觉较为一致的显著性目标.  相似文献   

8.
针对体育视频的分类问题,提出一种基于隐马尔可夫(HMM)模型的分类方法.首先,在各类运动训练视频片段的连续帧中提取4维运动特征向量,并基于特征向量训练各类的HMM.然后,将视频片段以状态序列表示,并利用HMM计算状态转换的概率,以此来检测运动事件.最后,基于各类运动的参考字典,通过相似度计算来匹配测试视频中的事件,最终实现对视频片段的分类.实验结果表明,该方法具有较高的分类精度.  相似文献   

9.
针对基于卷积神经网络(Convolutional Neural Network,CNN)的遥感图像超分辨率重建算法训练时间较长问题,提出了一种超深的卷积神经网络来重建遥感低分辨率图像的方法。卷积神经网络共有20层,每层包含卷积层和非线性层,层与层之间采用级联的网络结构。其过程为从插值的低分辨率图像(Interpolated Low Resolution Image,ILR)中提取特征,将提取出来的特征通过残差学习预测到高频信息,ILR结合预测的高频信息重建出高分辨率图像(High-resolution Images,HR)。在训练过程中,通过梯度裁剪来防止梯度爆破,使训练保持平稳。实验表明,本文算法与其他算法相比较,主观视觉明显改善,客观评价指标显著提升。  相似文献   

10.
基于脑电信号深度学习的情感分类   总被引:1,自引:1,他引:0  
情感脑电研究作为人工智能高级阶段的重要任务,近年来受到越来越多的关注。情感脑电分类广泛应用于人机交互、医学研究等领域。该文以轻量级的卷积神经网络为核心,设计了情感脑电分类模型,以DEAP(dataset for emotion analysis using physiologicalsignals)提供的情感脑电图数据为基础,将其中的观看视频划分为唤醒度和愉悦度2个维度。为了获得频域信息,提取了theta、alpha、beta和gamma波段的功率谱密度特征进行评估,并将功率谱密度矩阵表示为二维灰度图像。然后将该图像输入到卷积神经网络训练分类模型并完成2个维度的分类任务。实验结果表明,与传统机器学习相比,卷积神经网络具有更好的分类效果,唤醒度分类准确率达到了82.33%,愉悦度分类准确率达到了75.46%。  相似文献   

11.
针对体育运动的自动分类和运动员隐私问题,提出一种基于热成像数据与Fisher线性判别(FLD)的分类方法.首先,通过热成像相机获取10min的运动视频片段.然后,对于每一帧,通过单应性矩阵将其转换为三维世界坐标系,并通过像素占比来检测运动员的位置,标记为一个热点.接着,将所有帧中的运动员热点进行累积,形成运动热图.最后,利用主成分分析对热图进行降维,利用Fisher线性判别对热图进行分类.实验结果表明,对于预设的5种运动类型,该方案具有较高的正确分类率.  相似文献   

12.
针对3D-HEVC的多视点视频加深度图的编码格式和四叉树编码结构所带来的编码复杂度问题,提出了一种深度图像快速帧内预测模式选择算法。首先,从深度视频序列中以最优的深度图最大编码单元(largest coding unit,LCU)划分深度为标签获取训练集;其次,构建了适用于LCU的Cu深度快速选择卷积神经网络(fast selecting Cu’s depth-convolutionalneural network,FSCD-CNN);最后,对深度图LCU进行划分深度预测,跳过部分编码模式决策,实现最佳LCU划分。实验结果表明,与相关文献对比,所提算法在保持了编码性能的同时平均减少了15%的编码时间,实验验证了其有效性和可靠性。  相似文献   

13.
针对网球视频中网球和球员的自动跟踪面临着诸多困难,提出基于背景模型的目标跟踪方法.该方法通过平滑化所给出的图像、累加背景图像,创建一个平均背景模型,然后在当前帧和下一帧之间执行图像差分,并在所创建的背景图像中执行逻辑与操作并获得图像差分结果.实验采用两个网球公开赛视频序列评估提出方法的性能,实验结果表明,提出的方法能精确地检测和跟踪视频中球和球员,其中,第一个网球公开赛中的球跟踪率约为94.26%、球员跟踪精度约为91.49%,第二个网球公开赛中球跟踪率约为92.87%,球员跟踪精度约为90.75%.  相似文献   

14.
随机访问性能是评价多视点视频编码预测结构性能的一个重要指标,往往通过计算解码路径的复杂度来衡量. 该文提出一编码端和解码端联合计算的方法,通过对视频序列实际编码情况的统计来更新解码时的参考图像列表,进而获取更准确的参考帧信息. 实验结果表明,所提出的方法能准确地计算出所需的参考帧,且参考帧数量比现有方法更少,能有效提高随机访问性能.  相似文献   

15.
随着手持视频设备的普及,如何为这类低分辨率应用环境提供一种生成高质量图像的方法是一个值得研究的问题.讨论了如何从低分辨率、低质量的视频中创建清晰的、高分辨率图像的方法.针对当前多图像超分辨率技术没有考虑运动估计和重要帧的权值等问题,提出了一个基于时间显著性、局部图像统计特征来计算图像像素权值的方法,以实现更好的图像融合.提出的基于重要性的计算框架,降低了低质量帧的影响,显著提高了有效成分的作用.  相似文献   

16.
利用先进的数字化和智能化技术对我国古代文化遗产进行数字化应用和有效保护,以更快捷、更高效的方式解决凭借人力无法解决的问题,具有重要的现实意义。通过研究深度卷积神经网络在书法文字检测识别任务上的应用,设计了一个篆体书法文字检测识别的完整系统,包括数据采集、数据扩充、算法训练与测试和算法模型部署等流程。整个系统以YOLOv4目标检测算法为基础,根据篆体书法图像数据特征对采集得到的数据进行有效地扩充,进行多次训练和验证测试,最终获得了89.7%的平均精度、92.3%的准确率和94.7%的召回率,同时达到45张/s的识别速度;最终将识别检测模型部署至服务器端,并提供了接口供外部调用。实验证明设计的识别系统可以利用深度卷积神经网络自动、快速、准确地对篆体文字进行定位和识别,并且可以方便地调用训练和部署完成的模型。  相似文献   

17.
张涵  秦昆  毕奇  张晔  许凯 《应用科学学报》2021,39(2):272-280
场景级变化检测策略可以容忍高分遥感影像的大量噪声,进而从语义层级更准确地描述遥感图像在前后时相的变化,为高分辨率影像变化检测提供了可能。本文提出了一种注意力引导的三维卷积神经网络用于高分遥感影像场景变化检测的方法。首先构建一个在AlexNet基础上进行简化的三维卷积网络,然后加入一个语义注意力模块来进一步提取地表覆盖变化显著的候选判别区域;最后输入分类层得到分类结果,整个框架以端对端、可训练的方式进行组织,直接由双时相场景切片通过卷积网络得到变化检测结果。为评估场景级变化检测方法性能,本文制作了一个语义级高分遥感影像场景变化检测数据集,在该数据集上的实验结果显示本文方法变化检测的准确率高于相关方法,验证了方法的有效性,初步展示了基于深度学习的场景级遥感变化检测的发展前景。  相似文献   

18.
人脸活体检测技术作为人脸识别系统安全运行的重要保障,对保障网络空间安全意义重大.针对基于视频的人脸欺骗攻击,提出一种基于局部二值模式-多层离散余弦变换(local binary pattern and multilayer discrete cosine transform, LBP-MDCT)和卷积神经网络(convolutional neural network, CNN)融合的人脸活体检测算法.首先从检测视频中提取人脸图像;接着对人脸图像进行LBP和多层DCT变换以得到LBP-MDC T特征,将部分人脸图像输入CNN中以得到CNN特征;然后将两种特征分别输入到支持向量机(support vector machine, SVM)中得到分类结果;最后将SVM的输出进行决策级融合以判定检测视频的合法性.在Replay-Attack和CASIA-FASD数据库上的实验结果表明,相对于现有算法,该算法的检测性能更加优越.  相似文献   

19.
自然场景中文本检测易受光照、复杂背景、多语言文字、字体及尺寸等因素影响,该文提出了一种基于Itti视觉关注模型与多尺度最大稳定极值区域(maximally stable extremalregion,MSER)结合的自然场景文本检测算法.首先利用改进的Itti视觉关注模型提取文本特征图,并采用不同结合策略得到各尺度文本显著图;然后结合多尺度的MSER区域得到3种文本候选区域.根据文字与生成文本框的几何规则合并文本候选区域得到文本行;最后利用随机森林分类器除去非文本区域得到最终文本区域.实验结果表明,该方法对于自然场景图像中的文本检测具有较高的精确度和一定的鲁棒性.  相似文献   

20.
数字图像中常用模糊操作隐藏或抹去篡改的痕迹.为此,针对常用的高斯模糊、均值模糊及中值模糊操作的识别问题,构建了一种卷积神经网络模型,并给出其网络拓扑结构.在传统的卷积神经网络模型中添加一个信息处理层,提取出输入图像块的滤波频域残差特征,以提高网络模型对一次滤波与二次滤波操作的识别性.实验结果表明,所提方法的准确率较以往传统方法有较大提升,且泛化性能优越,能检测出主流的线性和非线性滤波操作。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号