首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
鉴于在图像中识别表格结构面临着表格样式众多、图像质量各异等难题,提出一种融合表格线与文字块信息的两阶段深度学习框架,以实现少线复杂表格结构的识别.首先,将残差结构引入U-Net语义分割网络中,增强网络传递表格线信息能力,完成表格线的识别;然后,加入文字块位置信息以提高模型识别无线或少线表格结构的能力.该方法在PubTabNet数据集上的树编辑距离(tree-edit-distance similarity, TEDS)评分达到95.95.实验证明,该方法在识别少线表或无线表时表现优秀,并能高效、准确地识别存在合并单元格的复杂结构表格.  相似文献   

2.
细菌耐药性的日益加剧,以及目前的耐药性检测方法周期长等问题,给临床第一时间准确用药带来极大的挑战和困境.为此,本文将探索深度学习技术在抗菌药物耐药性预测中的应用,提出一种融合注意力机制的双通道卷积神经网络模型,通过上下两个通道对建模后的送检数据做不同粒度的特征提取,每个通道经过卷积和池化后引入注意力机制,聚焦重要的特征信息,而后将两个通道的特征进行融合,从而完成分类输出.将模型在某三甲医院细菌药敏检测历史数据集上,与多种不同方法进行对比实验,结果表明,本文所提出方法在分类准确度F值指标中平均实现20.35%的提升,同时在小样本分类上表现出更好的效果.  相似文献   

3.
近年来,基于深度学习的语义分割方法得到了广泛应用.本文针对实际遥感图像中的语义分割问题,为了减少网络参数和计算量,以及提高网络性能,提出了一个使用通道注意力机制的卷积神经网络(channel attention network,CA-Net).首先,对高分二号(GF-2)遥感图像进行预处理和数据标注,得到一个7分类数据...  相似文献   

4.
场景文字识别的一个具有挑战性的方面是处理具有扭曲或不规则布局的文字.尤其是侧视文字和曲线文字在自然场景中较为常见,且难以识别.本文提出了一个带有灵活矫正功能的注意力增强网络,将其用于任意形状场景文字识别.此网络由基于卷积神经网络的文字矫正网络和基于注意力增强的识别网络两部分组成.矫正网络自适应地将输入图像中的文字进行矫正,降低识别难度,使基于注意力增强的序列识别网络直接根据矫正后的图像预测字符序列.整个模型可以进行端到端的训练,训练只需要图像和相应的文字真实标签.在各种公开数据集上进行了广泛的实验,包括SVT、ICDAR 2003和CUTE80等数据集,验证了此网络具有优异的性能.  相似文献   

5.
针对交通拥堵检测,提出一种利用深度学习中卷积神经网络(convolutional neural network, CNN)对交通拥堵图像进行检测的方法。首先,使用基于TensorFlow框架设计了含有三层卷积层的神经网络分类模型。其次,利用道路拥堵与非拥堵图片对分类模型进行训练,并进行评估。最后,利用训练完成的模型进行道路拥堵检测,与多种深度学习分类模型分类方法进行对比实验,表明该卷积神经网络模型能够更有效地进行拥堵检测,检测准确率达到了98.1%。  相似文献   

6.
目标识别和定位是计算机视觉领域研究的主要问题,图像分割、目标跟踪、目标行为分析等都是以图像中的目标检测为基础的.随着深度学习技术的发展,目标检测算法取得了巨大突破.在广泛调研相关文献的基础上,对目标检测算法进行分析和对比,分别研究基于区域提取的两阶段目标检测架构和直接位置回归的一阶段目标检测架构的本质特点和发展过程,并提出未来的发展方向.  相似文献   

7.
人体行为识别检测是计算机视觉领域的研究热点,主要包括行为识别和行为检测两大部分.目前,对行为识别检测的综述主要聚焦在行为识别领域,对行为检测的关注度偏低.针对这一现状,聚焦行为识别和行为检测两个方面,分别综述了行为识别以及行为检测的各种方法,介绍了常用的数据集.首先从网络结构的角度重点论述了基于深度学习的行为识别方法;而后将行为检测划分为时序行为检测和时空行为检测,总结行为检测的各种算法;最后对各种算法的特点进行了总结分析,探索行为识别与行为检测的区别与联系,对当前研究面临的问题以及下一步的工作进行了总结和展望.  相似文献   

8.
为了检测恶意程序中的虚假域名,便于识别僵尸网络和恶意程序,提出一种基于深度学习的虚假域名检测模型;该模型以域名字符串的字符序列为输入,利用一维卷积神经网络和自注意力机制,分别挖掘字符序列中各字符之间的局部依赖信息和全局依赖信息,将两者拼接在一起得到组合特征向量;借助多层感知机,得到待检测域名属于不同域名类别的概率.仿真...  相似文献   

9.
【目的】表格文档作为数据信息的主要载体,如何从海量表格中准确提取关键信息也是技术难点之一。【方法】现有的端到端方法和基于预训练模型的方法在训练过程中并未有效利用表格单元格的结构信息,影响了文本在模型中的向量表示,从而影响了最终的语义信息抽取精确率。故本文针对两类方法都存在的问题,提出了进一步利用单元格结构信息来改进OCR识别效果的端到端方法和增加单元格序列预测任务的预训练方法。【结果】实验结果表明,改进后的两种方法在表格语义信息抽取任务中取得了更好的效果,F1值分别提升了0.2046和0.0176。【结论】加强了单元格结构信息在表格中的重要性, 提高了表格语义信息抽取的精确率。  相似文献   

10.
提出了一种针对交通场景的基于深度学习的障碍物检测与深度估计方法。该方法对现有的YOLOv3模型进行改进,使用DenseNet网络代替原网络尺度较小的传输层,得到一种新的障碍物检测模型Dense-YOLO。然后采用立体匹配模型PSMNet得到双目图像的视差图,根据双目测距原理对被测目标深度进行估计。在KITTI数据集和实际交通场景中的实验结果表明,与YOLOv3模型相比,Dense-YOLO模型有效地提高了交通场景中障碍物检测的可靠性和正确率,对轿车、行人、骑行者和卡车这4类障碍物检测的平均精确率(average precision, AP)提高了3%~5%,平均精确率均值(mean average precision, mAP)提高了约4%。障碍物深度估计结果与真实值的平均相对误差约为3%。  相似文献   

11.
随着人们网络安全意识的提高,加密流量呈爆炸式增长,流量加密在保护用户隐私的同时,也为安全检测带来了新的挑战。针对传统基于机器学习的流量识别方法存在需要手动设计分类特征、分类准确率不高等问题,提出一种基于卷积神经网络与自注意力机制(Convolutional Neural Network and Self Attention, CSA)的加密流量分类方法,依据网络流量的层次结构特性,采用卷积神经网络提取数据包内字节流的空间特征、自注意力机制提取数据包之间的时序特征。在公开数据集ISCX VPN-NonVPN上的实验结果表明,CSA模型的分类准确率达到了95.0%,相较基准深度模型,准确率和F1值皆有明显的提升。  相似文献   

12.
庄建军  石潇愉 《科学技术与工程》2023,23(36):15538-15544
网购时代,五花八门的产品品牌让消费者选择困难,同时也滋生了大量线上商标侵权行为。为此,提出一种基于深度学习的商标检测方法。方法以YOLOv7-tiny网络模型为基础,首先,为提升多尺度检测能力,Neck部分的PAnet模块改为简化的自适应学习权重、多尺度特征融合网络SimBiFPN;接着,为关注关键语义信息,引入注意力机制,将Neck与Head间的卷积层Conv改为全维度动态卷积ODConv;最后,为了使算法具有像素级建模能力,将激活函数改为FRelu。选择天池平台数据集经Mosaic和Mixup数据增强后完成模型的训练与验证。结果表明:改进模型的mAP达到85.84%,较原始模型提升了近2个百分点,优于其他YOLO(you only look once)模型,且模型的参数量下降41%。所提方法有助于提高用户的在线购物效率,同时可加强商标侵权的打击力度。  相似文献   

13.
提出一种基于深度卷积神经网络的化妆品塑料瓶表面缺陷检测算法。采用百万像素级别的工业相机采集大量的塑料瓶图像样本,并通过HSV(hue,saturation,value)颜色空间变换和Otsu阈值分割等方法对图像进行预处理。采用随机图像变换法对数据集进行增强,并对图像进行标准归一化处理。在卷积神经网络模型中应用深度可分离卷积和Dropout技术以减少参数量,从而避免过度拟合。使用训练样本集训练该模型,并在测试集中将结果与几种经典图像识别算法进行比较分析,结果显示,本文算法的识别准确率高达约0.97。由此表明本文算法的效果优于其他经典算法,有望将其应用于化妆品塑料瓶缺陷检测的工业自动化系统,以提升缺陷识别效果,从而提高生产效率。  相似文献   

14.
针对传统基于机器学习损伤识别方法手工提取特征适应性差、识别能力弱等问题,提出一种基于卷积神经网络和迁移学习的新颖、快速结构损伤识别方法.首先根据损伤特征向量特点,提出原始信号的分帧处理流程;其次考虑多传感器数据融合要求,建立多通道一维卷积神经网络结构损伤识别模型,给出模型的整体流程和网络参数;然后采集不同通道和不同噪声水平下,模拟不同位置程度损伤的15层框架数值模型加速度数据,进行损伤识别;最后将网络模型进行迁移学习,对7层框架模型试验进行损伤识别,并验证所提方法的可行性、准确性和计算复杂性.结果表明,该方法实现了特征自适应提取、损伤位置和损伤程度的精准识别,具有突出的计算效率.  相似文献   

15.
雒翠萍  聂志刚 《甘肃科技》2022,38(1):23-25+50
人脸面部表情是人机交互和非言语交际的有效方式,对面部表情进行识别并分析,可以获取很多信息,在安全监控、人工智能、军警、心理学等领域有着许多不同的应用。本研究基于深度学习对人脸表情识别进行深入研究,采用Open CV内置算法进行人脸检测,利用卷积神经网络进行面部表情识别,实现对人脸最基本的7种表情包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中立分别进行识别。与传统的人脸表情识别方法相比较,卷积神经网络的识别精度高,训练参数少,在面部表情特征表现明显的情况下,对7种表情的识别精度都能超过70%以上。  相似文献   

16.
针对在大规模农业种植中传统人工农作物病虫害预防和治理上常存在的问题,应用深度学习算法来进行农作物病害的检测.对47 637张图片进行病害识别检测,数据包含10个物种(主要农作物有番茄、土豆、玉米等),27种病害,总共61个分类标签.采用目前流行的深度网络结构如Vgg-16,ResNetV1-101和InceptionV4等6种模型对图像进行特征抽取.采用交叉熵和正则化项组成损失函数进行反向传播调整,对数据集进行4种不同情况的划分;并且使用了初始化和迁移训练两种训练方式,分别对6种网络架构在不同学习率下进行试验比较.结果表明:采用初始化训练对61类病害情况的最高识别准确率为84.6%;而在迁移训练中,使用合适的学习率训练,最高识别准确率达到86.1%;对3类疾病程度分类准确率为87.4%,对28种病害类型分类准确率为98.2%,对10类物种识别分类准确率为99.3%.  相似文献   

17.
18.
传统人体行为识别基于人工设计特征方法涉及的环节多,具有时间开销大,算法难以整体调优的缺点。以深度视频为研究对象,构建了3维卷积深度神经网络自动学习人体行为的时空特征,使用Softmax分类器进行人体行为的分类识别。实验结果表明,提出的方法能够有效提取人体行为的潜在特征,不但在MSR-Action3D数据集上能够获得与当前最好方法一致的识别效果,在UTKinect-Action3D数据集也能够获得与基准项目相当的识别效果。本方法的优势是不需要人工提取特征,特征提取和分类识别构成一个端到端的完整闭环系统,方法更加简单。同时,研究方法也验证了深度卷积神经网络模型具有良好的泛化性能,使用MSR-Action3D数据集训练的模型直接应用于UTKinect-Action3D数据集上行为的分类识别,同样获得了良好的识别效果。  相似文献   

19.
近年来,受结肠疾病困扰的人群数量不断增加,由于诊断不及时,结肠疾病容易演变成结肠癌,严重威胁患者的生命健康。结肠息肉是结肠癌在患者体内的前期表征,通过结肠镜及时准确地检测结肠息肉并进行干预可以降低结肠癌发生的概率。目前,深度学习在医学图像处理领域应用广泛,在结肠镜图像息肉检测中应用深度学习技术,可以帮助医生进行精确诊断。针对传统方法在肠息肉检测中因息肉成像差异大、肠息肉类型多样等存在假阳性高的问题,利用U-net++网络对结肠息肉进行检测,提出一种引入注意力机制的U-net++改进模型,采用端到端的结构,并针对不同网络进行实验研究,对不同网络模型在结肠息肉检测结果进行精度和损失度对比分析。经过实验验证,引入注意力机制的U-net++改进网络模型能够快速精确地检测结肠息肉,可以更好地辅助医生进行临床决策和干预,具有重要的研究意义和临床应用价值。  相似文献   

20.
针对目前青椒体型小、数量多、质量分类困难的问题,提出了利用深度学习中的卷积神经网络来解决青椒质量分类的方法。该方法无需消耗大量人力资源,直接将青椒图像作为输入,模型自动从训练数据中提取有利于区分青椒质量的图像特征。研究结果表明,当使用3 200张青椒图片作为训练数据时,得到的训练模型在含有960张图片的独立验证集上的识别准确率达到了97.60%。这为青椒质量分类问题提供了一种新的解决办法,同时也可用于其他瓜果蔬菜的质量识别问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号