排序方式: 共有17条查询结果,搜索用时 15 毫秒
1.
运动信息对行为识别任务至关重要。现有方法仅利用了局部运动信息,忽略了全局运动信息的重要作用。为解决该问题,提出了一种基于低秩分解与多流融合的行为识别方法。通过3条支路分别提取视频的特征,第1条支路利用低秩分解提取全局运动信息;第2条支路提取视频的光流特征以得到局部运动信息;第3条支路利用原始视频作为输入,以保留完整的空域信息。将3条支路的预测结果进行后融合,得到最终的行为识别结果。通过多流融合,充分利用视频的多尺度时域运动信息和丰富的空域信息,提高现有模型的行为识别能力。实验结果表明,提出的方法优于现有模型的多流融合行为识别方法。 相似文献
2.
图像有损压缩过程往往会导致图像质量退化,使图像出现压缩伪影。针对现有基于深度学习的方法缺乏对联合图像专家组(Joint Photographic Experts Group,JPEG)压缩算法先验信息的利用,提出一种基于变换域注意力机制的去伪影方法。该方法利用卷积神经网络在像素域和离散余弦变换(discrete cosine transform,DCT)域分别提取特征,再将双域学习的特征信息进行融合。利用量化表设计了DCT注意力机制,该模块根据DCT系数的损失程度给予各频率系数不同的权值,使网络自适应补偿量化引起的误差。于此基础上,在像素域引入通道注意力机制,从而更好地利用量化表的先验信息。在主要数据集上,提出的去伪影方法以固定的模型参数对多种质量因子的压缩图像进行伪影去除实验。实验结果表明,所提出的方法在各评价指标和主观视觉上取得较好的效果。 相似文献
3.
针对红外小目标占用像素较少、背景相似性强、网络容易受到背景杂波信息干扰的问题,提出了一种基于注意力机制的红外小目标检测方法。利用注意力机制模块抑制背景杂波,增强小目标特征,并使用红外小目标检测模块实现检测任务;为了增强网络鲁棒性,通过高斯噪声与原图通道堆叠输入的数据增强方式提升网络抗杂波干扰的能力。实验表明,提出的方法在MDvsFA数据集中的性能超过了目前最新的对比算法。 相似文献
4.
自然场景文本区域定位是场景图像内容分析的重要步骤,文本区域定位能够为后续的文本识别提供便利.从场景文本特性出发,提出了一种基于最大极值稳定区域(maximally stable extremal regions,MSER)、颜色聚类和视觉显著性的鲁棒性文本定位方法.为了尽可能多地提取出潜在的文本区域,分别在灰度图像和彩色图像上采用最大极值稳定区域和颜色聚类来进行连通域的分析.对于得到的候选连通域,利用自然场景文本的显著性特征和少量的先验信息来滤除其中的非文本区域.将保留的文本区域用数学形态学水平膨胀的方法连成文本行输出.显著性评估的引入使得该方法能够减少大量参数的设定.标准数据集上的实验结果表明,在没有额外的训练数据和少量先验信息的情况下,该方法可以获得较好的正确率和召回率. 相似文献
5.
视频特征的提取是行为识别方法中一个关键步骤,当视频场景中存在无关行人或者背景干扰时,提取的特征往往会包含较多的干扰信息,这将严重影响分类器的分类效果,进而影响行为识别准确率。针对这类问题,提出了一种基于显著性区域的红外行为识别方法。该方法对视频序列提取光流运动历史图(optical flow motion history image, OF-MHI)特征,获取视频序列的运动信息,此步骤旨在消除图像背景及静止目标干扰。利用类别激活映射(class activation map, CAM)方法进一步消除运动目标干扰,获得兴趣目标显著性区域,进而获得显著性区域特征图。输入卷积神经网络(convolutional neural network, CNN)提取最终特征,并采用支持向量机(support vector machine, SVM)获得识别结果。与传统方法相比,实验结果表明,该方法有效地提升了识别准确率。 相似文献
6.
引导滤波和三维块匹配结合的红外图像去噪 总被引:1,自引:0,他引:1
针对红外图像存在噪声较大的问题,提出了一种引导滤波和三维块匹配结合的红外图像去噪方法.该方法通过将引导滤波与三维块匹配方法相结合,采用二次联合滤波的策略减轻了三维块匹配去噪方法在平滑区产生明显的“抓痕”现象.通过BM3D (block method of 3-dimension)去噪方法得到初始滤波图像;对噪声图像在低尺度进行BM3D去噪得到比较平滑的引导图像,用引导图像指导初始滤波图像进行二次滤波.仿真结果表明,提出的算法既保持了BM3D去噪算法的优秀性能,且具有更好的视觉效果和更高的峰值信噪比及结构相似度. 相似文献
7.
森林背景下,有效的烟雾检测在避免大规模森林火灾方面具有极其重要的意义。当前的研究对烟雾移动得很慢或没有清晰背景的情况下往往表现较差的性能,提出一种针对烟雾检测的自适应区域生长法。采用改进的卡尔曼滤波检测出运动区域,假设烟雾的亮度与视频照度之间存在线性关系,采用支持向量机(support vector ma-chine,SVM)线性回归方法得到烟雾亮度的近似范围,并定义亮度约束,基于检测得到的运动区域,同时考虑亮度约束和纹理约束,蔓延出烟雾区域的主要部分,提取基于区域的特征来做 SVM分类。对比实验结果表明,该方法优于传统的方法,并具有更强的鲁棒性。 相似文献
8.
几种典型红外弱小目标检测算法的性能评估 总被引:2,自引:0,他引:2
对基于中值相减滤波、最大中值相减滤波、最大均值相减滤波和推广的结构张量的红外弱小目标检测算法的性能进行了评估.针对传统评估方法的不足,提出了一种基于支持向量回归的红外弱小目标检测算法性能评估方法.利用该方法分别从图像背景特性和目标特性2方面对4种检测算法性能的影响进行定量分析和比较.实验结果表明,图像背景特性和目标特性对4种算法的检测性能都有较大的影响,而目标特性与4种算法的检测性能的依赖关系更明显;在4种评估算法中,基于推广的结构张量算法比其他3种传统红外弱小目标检测算法具有更好的鲁棒性. 相似文献
9.
在密集场景中,人流量统计往往因无法可靠地检测行人而使得统计精度不高.针对这一问题,在利用卷积神经网络技术基础上,采用基于头部检测的方法进行人流量统计.该方法采用级联的Adaboost检测器对人头目标进行初步筛选,再用迁移学习技术训练卷积神经网络,并用由卷积神经网络和支持向量机构成的人头分类器模型对初步筛选得到的人头目标进行精细识别,提高检测精度率,利用航迹关联对人头目标进行跟踪统计.实验结果表明,该方法能准确快速地定位到单个行人并具有较高的统计精度. 相似文献
10.
对于第一人称行为识别任务,现有方法大多使用了目标边界框和人眼视线数据等非行为类别标签对深度神经网络进行辅助监督,以使其关注视频中手部及其交互物体所在区域。这既需要更多的人工标注数据,又使得视频特征的提取过程变得更为复杂。针对该问题,提出了一种多尺度时序交互模块,通过不同尺度的3D时序卷积使2D神经网络提取的视频帧特征进行时序交互,从而使得单一视频帧的特征融合其近邻帧的特征。在只需行为类别标签作监督的情况下,多尺度时序交互能够促使网络更加关注第一人称视频中手部及其交互物体所在区域。实验结果表明,提出的方法在识别准确率优于现有第一人称行为识别方法。 相似文献