首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 795 毫秒
1.
将深度学习应用于行人重识别领域,嵌入多尺度注意力融合模块至神经网络中进行多尺度特征提取和表示,可有效提升注意力机制对深度学习网络的识别性能。提出了一种基于SE block的多尺度通道注意力融合模块,并结合ResNet50卷积神经网络提取特征;然后通过双向LSTM网络进一步提取特征序列上下文信息,在提高模型对图像重要特征的提取能力的同时,降低对图像冗余特征的关注度;最后使用级联难采样三元组损失函数和交叉熵损失函数共同训练网络模型,使样本能够在高维特征空间中实现聚类,进一步提升模型识别准确性。所提出算法在Market1501数据集和CUHK03数据集分别进行实验,并在同等条件下和其他注意力模块算法进行比较。为进一步验证各模块作用,对算法进行消融实验,以验证各模块的有效性,实验结果表明,所提出方法可有效应用于行人重识别  相似文献   

2.
人体姿态估计是计算机视觉领域的研究热点之一,目标是从给定的图像或视频中识别人体的关节.由于篮球比赛视频中人体动作复杂多变,易产生运动模糊、遮挡等问题,导致现有的人体姿态算法对篮球动作姿态估计的准确率较低.针对这一问题,提出了一种基于多尺度时空关联特征的篮球动作姿态估计算法,构建基于Transformer的人体时序特征捕捉模块对序列层级的时空特征信息进行建模,以缓解运动模糊、遮挡等现象带来的负面影响.此外,针对人体外形复杂多变的问题,提出了基于可形变卷积的人体空间特征残差融合模块来获取更为充分的空间特征.与现有算法相比,该算法在自行构建的篮球场景人体运动数据集、姿态估计公开基准数据集PoseTrack2017和PoseTrack2018均取得较好的效果.  相似文献   

3.
由于图像成像机理差别较大,现有的算法无法提取可见光与红外异源图像上的共有特征用来匹配,进而无法实现异源图像目标识别. 针对此问题,本文提出了一种基于自标签技术的深度学习特征点提取匹配算法. 算法通过设计一个粗特征检测器并在合成影像上进行训练,使得该特征检测器在不同图像上都具特征提取能力. 利用本文提出的自标签方法将异源图像中共有的特征点进行提取,从而解决了现有算法无法获取异源图像共有特征的问题. 并利用自标签结果进行特征点检测器和描述子的训练,最终通过匹配的特征点实现了异源图像间的实例目标识别. 本文采集了不同场景下的可见光-红外无人机影像作为测试数据. 在异源测试数据集上,选择了6种不同的先进算法与本文算法进行了对比试验. 实验结果表明,该算法较现有的6种先进算法能够提取到更多、更精确的异源图像共有特征,与其他测试算法相比在异源图像测试数据上的平均精度有了明显提升.   相似文献   

4.
在自然场景文本图像超分辨中,针对先验信息利用不准确、不充分以及文本边缘恢复不完整的问题,提出了一种基于文本语义指导的自然场景文本图像超分辨方法。该网络结构由超分辨重建模块和文本语义感知模块组成。为进一步提高超分辨网络的表达能力,提出使用循环十字交叉注意力,捕获全局上下文信息,使得模型在训练的过程中更加关注文本区域,同时,提出软边缘损失、梯度损失对重建过程进行约束,生成具有锐利边缘的超分辨结果。采用公开的自然场景文本图像超分辨数据集TextZoom对提出模型的性能进行验证,与8种主流深度网络模型进行了对比,结果表明:该模型在3个不同识别器下的平均识别率相比TSRN分别提升了2.06%、1.80%和2.89%,在PSNR和SSIM指标上也具有一定的优势。  相似文献   

5.
研究了基于小波变换的图像文本信息提取模型,提出了一种在小波域内提取图像文本信息的算法,该算法首先对图像进行二维小波变换,设置滑动窗扫描高频子带,计算滑动窗内图像的小波纹理特征,采用k-均值聚类算法提取文本区域,再对原图像进行边缘检测,根据文本区域的相关特征精确地定位文本区域,最后将文字与背景分离.从实验结果可以看出该算法能够较准确地从背景图像中提取出不同语种、字体、大小的文本信息.  相似文献   

6.
自然场景文本识别是计算机视觉领域一项极具挑战性的任务,为此提出一种适用于任意方向的自然场景文本识别算法.使用高分辨分割网络作为基础框架提取文本的空间信息,利用卷积长短时记忆网络提取文本的时空序列信息,同时通过设计字符注意机制使模型专注于字符上,并采用可微分二值化函数进一步加大网络对前景的注意力,削弱对背景区域的关注,网...  相似文献   

7.
针对现有的文本区域检测网络对图像特征提取不充分,导致文本行间距过小或字间距过大的电气铭牌文本区域检测准确率低、误检率高,提出一种融合ResNet的改进CTPN算法用于电气铭牌文本区域检测.该模型在卷积神经网络模块中引入残差连接和并行卷积核操作,提升模型对铭牌图像提取特征的能力.在长短期记忆网络模块采用双向门控单元,降低模型训练难度.经实验验证,改进后的CTPN模型F值(F-measure)明显提升,对铭牌文本区域误检率显著降低.  相似文献   

8.
针对传统机器学习车辆检测算法对复杂场景下车辆检测率低的问题,提出了一种并行交叉PCANet车辆检测算法,该算法使用2条PCANet,用实际车辆图像数据集和卷积神经网络提取的车辆轮廓图像数据集训练2个特征提取器,并且将提取的特征进行融合,作为最终的车辆特征,训练SVM分类器.实验结果表明,相比于传统的车辆检测算法,本文提出的检测算法结构简单,学习更充分,识别效率更高,具有较好的分类效果和检测效果.  相似文献   

9.
针对现有二值化文本提取算法在弱光照条件下易受非均匀光照的干扰,导致提取结果中错误较多、识别率变低的题,提出了一种面向弱光照条件的文本信息提取的预处理算法。基于Retinex理论将图像照度分量和反应文本属性的反射分量有效分离,此外,将L0平滑滤波引入文本图像处理中,有效抑制文本图像的背景干扰。实验结果表明,所提算法能够提高现有算法在弱光条件下的文本提取精度,扩展现有算法的应用范围。  相似文献   

10.
针对晴、阴、雾天环境下道路场景中运动目标提取问题,探讨基于特征量融合的天气类型判别算法,借助不同天气下的图像特征信息研究运动目标提取算法。基于不同天气下多种场景的视频图像序列,实验结果表明,获得的天气类型判别算法能较好地依据图像的历史信息判别天气的类别;目标提取结果表明,获得的目标提取算法能有效消除噪声,并且提取运动目标的效果较好。  相似文献   

11.
基于深度学习的场景文本检测普遍缺少特征级的精细化,导致原本设计良好的模型不能被充分利用,提出将特征融合和特征金字塔注意力模块应用到场景文本检测.将基本特征提取网络(PixelLink算法)得到的4个特征映射层以采样后加权叠加的方式进行特征融合,并将结果送给特征金字塔注意力模块.特征融合使各层级的特征信息相结合,从而增加...  相似文献   

12.
为解决传统算法对文本区域检测查准率较低的问题, 从自然场景文本特性出发, 提出了一种基于视觉显 著性与边缘密集度的鲁棒性文本定位方法。 首先利用谱残差理论提取图像的显著性区域, 然后在提取的显著 性区域中寻找边缘密集度大的区域, 以此构建候选连通域, 利用少量的先验信息滤除其中的非文本区域。 在标 准数据集上的实验结果表明, 与单纯利用边缘特征进行文本区域检测的方法相比, 该方法可获得 70% 的综合 检测率。  相似文献   

13.
谢红  宁志刚  张磊 《应用科技》2009,36(6):34-37
提出了一种对角DCT和模块2DPCA相结合的人脸识别方法.该算法首先将人脸图像转换成对角图像,提取人脸的行、列与结构信息以求解最优识别向量.然后利用DCT压缩以去掉人眼不敏感的中频分量与高频分量,再由IDCT重建人脸图像,这样有限降低了所需特征的维数,减少了计算量.然后通过模块2DPCA进行特征提取得到人脸识别特征,最后运用最近邻分类器完成人脸的识别.基于ORL及Yale人脸数据库的实验结果证明了该算法的有效性与稳健性.  相似文献   

14.
复杂自然场景中准确提取和检测文本信息是文本识别的基础和前提,它受到文本尺寸、摆放角度甚至是姿态的影响.针对传统算法中滑动窗口都是固定大小,一些自然场景图像中的文本检测难,图像边界呈现冗余,运算量增大,运算时间长等问题,通过改进滑动窗口区域生成网络(Region Proposal Network,RPN)策略,提出一种改进的RPN(Improved RPN)网络模型,运用共享的目标检测和回归检测算法提取其中的网络结构,最终得到一种改进的Faster R-CNN文本检测算法.在数据集中分别选取对比度高、对比度低和任意对比度进行不同算法的文本检测结果对比,实验结果表明,本文算法具有较好的检测效果.  相似文献   

15.
基于内容的索引和检索是实现巨量数字视频资料有效检索与浏览的一种重要方法,是当今的研究热点之一,而检测提取其中的文本是实现该目标的一个重要途径。文章提出一种检测提取图像中文本的新方法,其特点在于应用模糊技术对子图像变异灰度直方图(VGH)中的文本映射特征进行识别,从而实现检测定位图像中的文本;在讨论子图像VGH中文本映射特征性质和阈值参数选取算法的基础上,着重研究了模糊技术用于文本映射特征识别问题,给出了具有鲁棒性的文本检测提取算法;实验结果表明,新方法切实可行,相关算法正确有效。  相似文献   

16.
一种复杂文本图像中快速文本行检测算法   总被引:1,自引:0,他引:1  
图像中的文本常常包含许多对图像理解,图像处理有用的信息,因此文本检测和提取被应用到很多应用当中如文档分割,文本修复,机器视觉,车牌检测与识别等.提出了一种基于游程分析的快速检测文本的算法,算法对图像中水平黑,白游程进行分析,把同一文本区域中的空白填满(变黑),而把文本行间过长的笔画切断,然后做基于游程的连通域分析,再根据三条基于文本特征的判断准则进行筛选得到文本行区域。实验证明,该算法可以同时提取不同字体,字号,语种的文本行,并且对Logo,条形码等非文本准确判定。  相似文献   

17.
针对储物柜存取货物场景的实际情况和人员行为的特点,提出一种通过融合时间调整机制控制前景融入背景的改进型混合高斯建模检测方法,并引入手臂识别机制。融合时间调整机制减小了由于人员停止运动而错误决策为背景的可能性;手臂识别算法模型有效地识别人员伸手动作。实验结果表明,该方法可以简单有效地从连续的图像序列中检测出人员在储物柜场景下的存取货物行为。  相似文献   

18.
周联敏  周冬明  杨浩 《科学技术与工程》2022,22(34):15237-15244
为了能有效地去除真实图像的复杂噪声,提出了一种结合迁移学习的真实图像去噪算法。该算法采用了双编码器结构,迁移学习编码单元利用预先训练好的权值有效提取鲁棒特征,残差编码单元对当前数据处理,进一步补充了信息。解码单元通过特征融合模块对丰富的信息进行融合,随后经过残差注意力模块加强对图像细节信息的关注,从而更好地恢复图像。实验结果表明,该算法在DND、SIDD和RNI15真实噪声数据集上有很好的泛化能力,能够在有效去除噪声的同时更好地保留图像纹理和边缘信息,恢复图像视觉效果更好。  相似文献   

19.
针对SURF匹配算法,提出一种局部特征匹配的思想,对场景中多个目标机器人进行识别与跟踪。在静态场景中,利用背景差法检测出场景中所有运动机器人,提取各个机器人的轮廓,通过轮廓获得每个机器人在图像中的区域,对每个小区域提取SURF特征点并与模板图像进行匹配,得到想要跟踪机器人的位置信息,最后通过Kalman滤波对机器人位置进行修正并跟踪。实验证明本算法在不降低匹配的准确性上有效提高了识别与跟踪的效率。  相似文献   

20.
现有的光学印刷体汉字识别(OPCCR)系统中,汉字识别率虽然已经高达98%以上,但仍然会发生错误识别的情况.通常,这些错误的识别还不能被自动检测,采用人工检测,费时费力,大大降低了实际应用系统的自动化和智能化程度.为此,本论文提出了基于网格笔划密度特征的OPCCR错误的自动检测算法.本算法首先建立标准汉字的网格笔划密度特征的特征库.然后,在OPCCR错误的自动检测时,对光学印刷体汉字图像进行预处理、行分割、列分割得到单个汉字图像,提取单个汉字图像的网格笔划密度特征.再把特征和相应的识别出的汉字的特征库中的特征进行相关匹配.于是,根据特征匹配自动检测OPCCR的错误.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号