期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

汪晓洲石翠萍杨焜王权《齐齐哈尔大学学报(自然科学版)》2021,37(5):11-15

为了解决场景遥感图像通常分类性能较差、分类精度不高的问题,提出一种基于改进VGG16的场景遥感图像分类方法.针对传统VGG16模型参数量庞大的问题,对通道数以及参数量进行缩减.在算法运行过程中对数据进行正则化处理,并在分类方法中加入注意力机制.通过将注意力机制与CNN模型进行结合,并对两者进行端到端的训练,提高了模型的... 相似文献

2.

基于两阶段深度学习的表格结构识别方法

孙寅生袁贞明《杭州师范大学学报(自然科学版)》2024,(3):255-264

鉴于在图像中识别表格结构面临着表格样式众多、图像质量各异等难题,提出一种融合表格线与文字块信息的两阶段深度学习框架,以实现少线复杂表格结构的识别.首先,将残差结构引入U-Net语义分割网络中,增强网络传递表格线信息能力,完成表格线的识别;然后,加入文字块位置信息以提高模型识别无线或少线表格结构的能力.该方法在PubTabNet数据集上的树编辑距离(tree-edit-distance similarity, TEDS)评分达到95.95.实验证明,该方法在识别少线表或无线表时表现优秀,并能高效、准确地识别存在合并单元格的复杂结构表格. 相似文献

3.

基于深度学习的图像语义分割研究进展

李新叶宋维《科学技术与工程》2019,19(33):21-27

图像语义分割是对图像中的每个像素点进行分类,将图像中的前景和背景区分并且识别出每个前景的类别。随着深度学习技术的发展,传统图像语义分割方法在分割精度和分割速度上已经彻底被超越。针对深度学习图像语义分割方法研究现状进行综述,对近年来国内外基于深度学习图像语义分割方法主要思想、优缺点进行了分析和总结。提出了该领域目前存在的问题,对将来的发展进行总结和展望。相似文献

4.

基于深度学习的图像抠图技术

王榕榕徐树公黄剑波《上海大学学报(自然科学版)》2022,(2):261-269

图像抠图(image matting)技术是图像编辑技术的基础,广泛应用于影视后期制作和日常生活.基于深度学习的图像抠图网络,通过输入的原图和三元图来估计每个像素的α值.在原下、上采样的图像抠图技术基础上,针对抠图数据集图像差异较大容易造成网络收敛较慢的问题,在每个卷积层后加入了批量标准化(batch normalization,BN)层,对输入数据进行归一化操作,加快模型收敛速度,同时参数更新方向更符合数据集整体特性;针对抠图任务需要更关注物体边缘部分的特点,使用可变形卷积(deformable convolution)层替换普通卷积层.可变形卷积层会根据不同输入数据自适应学习卷积核形状,有效扩大感受野范围,在细节部分有更好的预测效果. 相似文献

5.

基于深度学习的任意形状场景文字识别

徐富勇余谅盛钟松《四川大学学报(自然科学版)》2020,57(2):255-263

场景文字识别的一个具有挑战性的方面是处理具有扭曲或不规则布局的文字.尤其是侧视文字和曲线文字在自然场景中较为常见,且难以识别.本文提出了一个带有灵活矫正功能的注意力增强网络,将其用于任意形状场景文字识别.此网络由基于卷积神经网络的文字矫正网络和基于注意力增强的识别网络两部分组成.矫正网络自适应地将输入图像中的文字进行矫正,降低识别难度,使基于注意力增强的序列识别网络直接根据矫正后的图像预测字符序列.整个模型可以进行端到端的训练,训练只需要图像和相应的文字真实标签.在各种公开数据集上进行了广泛的实验,包括SVT、ICDAR 2003和CUTE80等数据集,验证了此网络具有优异的性能. 相似文献

6.

基于深度学习的图像抠图技术

下载免费PDF全文

王榕榕徐树公黄剑波《上海大学学报(自然科学版)》2021,28(2):261-269

图像抠图(image matting)技术是图像编辑技术的基础, 广泛应用于影视后期制作和日常生活. 基于深度学习的图像抠图网络, 通过输入的原图和三元图来估计每个像素的 $\alpha$ 值. 在原下、上采样的图像抠图技术基础上, 针对抠图数据集图像差异较大容易造成网络收敛较慢的问题, 在每个卷积层后加入了批量标准化(batch normalization, BN)层, 对输入数据进行归一化操作, 加快模型收敛速度, 同时参数更新方向更符合数据集整体特性; 针对抠图任务需要更关注物体边缘部分的特点, 使用可变形卷积(deformable convolution)层替换普通卷积层. 可变形卷积层会根据不同输入数据自适应学习卷积核形状, 有效扩大感受野范围, 在细节部分有更好的预测效果. 相似文献

7.

基于深度学习的变电站巡检机器人道路场景识别

刘明春张葛祥黄占鳌鲜开义黄志伟《科学技术与工程》2019,19(13)

为了提升变电站巡检机器人对自身所处环境的理解能力,将深度学习技术应用于变电站巡检机器人对道路场景的识别中,提出了一种全卷积道路场景识别网络(road scene recognition net,RSRNet)。该网络主要由相对浅层的编码网络和镜像结构与跳层融合结构相结合的解码网络组成,通过编码网络提取图像特征后由解码网络识别出图像目标信息。通过实验表明,本文提出的网络在同类型网络中识别精度及效率更高,同时在实际变电站场景中也表现出了优良的场景识别性能。相似文献

8.

基于深度学习的水泥颗粒检测方法

向科峰张津晨刘自红《西南科技大学学报》2023,(1):98-104

水泥生产过程中需要实时检测水泥颗粒粒径、圆度等几何参数。针对粒度离线检测效率低、参数调整滞后的现状,基于深度学习搭建并优化了水泥颗粒图像分割网络模型。实验表明：基于深度学习的水泥颗粒图像分割网络模型对水泥颗粒图像的分割精度达98%、分割准确度达94%,与离线检测的误差在8%以内。提高了分割精度和检测效率,满足水泥生产中过程控制智能化和信息化要求。相似文献

9.

基于深度学习的医疗影像识别技术研究综述

张琦张荣梅陈彬《河北省科学院学报》2020,37(3):1-8

相似文献

10.

基于深度学习的车辆前方障碍物距离估测

王玉堂《辽宁大学学报(自然科学版)》2023,(3):248-257

随着科技进步,自动驾驶系统的应用在未来必形成一种趋势,而车辆与障碍物之间的距离估测是自动驾驶系统中一个非常重要的技术.为了达到距离估测的目的,目前开发的自动驾驶系统大都需要依靠各式各样的距离传感器,例如激光雷达、雷达及超音波等,这些传感器在距离量测上通常具有高精度,但同时也伴随着高昂价格,这使自动驾驶系统的推广及普及变得越来越困难.本文提出了一个结合语义分割与深度估测的深度神经网络模型,其包含有相同卷积层数的编码器与解码器网络,将本文所提之网络架构在KITTI及Cityscapes资料集上进行训练,并在最后结合语义分割与深度估测等方法进行距离估测,实验结果证实,本文所提方法具有可行性. 相似文献

11.

多特征融合的道路场景语义分割算法

谷湘煜刘晓熠周仁彬《科学技术与工程》2021,21(33):14251-14257

为提升道路场景语义分割的性能以及实际应用性,本文将传统的图像处理算法与深度学习技术相结合,提出了一种多特征融合的轻量级道路场景语义分割网络模型。该模型首先利用颜色空间转化、图像均衡化、边缘检测等算法来对图像多种特征信息进行增强;其次,以深度可分离卷积为基本单元搭建高效率特征提取结构,对特征增强后的图像进行信息融合和提取,并结合跳层上采样操作完成初步分割;最后,引入边缘检测支路来对分割图像的目标边界信息进行细化,保障网络高精度分割。通过实验结果表明,所提网络在分割精度、计算效率上得到了较好的平衡,同时,在实际变电站道路场景应用中,该网络也能实现高效语义分割,为巡检机器人提供有效的道路信息。相似文献

12.

一种基于深度学习的实时视频图像背景替换方法

谢天植雷为民张伟李志远《东北大学学报(自然科学版)》2021,42(11):1540-1546

针对视频会话业务的实时性需求,提出一种轻量级深度学习网络模型实现视频图像的实时背景替换功能.网络模型包含语义分割和背景替换两个模块.语义分割模块整体架构采用编解码结构,编码端使用编码器模块、空洞卷积金字塔池化模块、注意力模块以及增益模块提取特征;解码端使用解码器模块、调整模块以及编码器模块恢复图像,再传入背景替换模块完成背景替换.该网络模型在本文设定的数据集训练后分割精确度达到94.1%,分割速度达到42.5帧/s,在实时性和准确性上达到较好的平衡,具有很好的实用效果. 相似文献

13.

基于密度自适应深度网络的点云场景语义分割算法

卫刚赵安铭王志成《同济大学学报(自然科学版)》2021,49(6):900-907

由于传感器噪声干扰,点云密度不均匀,场景复杂多样以及物体之间存在遮挡现象等问题,使得三维点云场景语义分割问题的研究工作极具挑战性。针对三维点云数据采样密度不均匀以及图卷积网络深度有限的问题,提出一种密度自适应的方法。该方法通过多层感知器学习一个权重函数,利用核密度估计学习一个密度函数,对非均匀采样的点云数据进行卷积操作。同时,受深度学习在图像领域的启发,引入残差连接、空洞卷积等结构,训练更深层的点云分割网络。该算法在多个点云分割的标准数据集上取得了优秀的性能。相似文献

14.

基于深度学习的CT影像肺结节检测

赵梓淇裴昀常振东王博安烁文李文辉《吉林大学学报(信息科学版)》2019,37(5):572-581

为辅助医生检测大量肺部CT( Computed Tomography) 图像中难以发现的肺结节的问题,提出使用深度U-Net网络对肺部结节进行分割。由于U-Net 网络出自于全卷积网络( FCN: Full Convolution Network) ,特点是端到端,像素到像素,网络对每个像素点进行分类,能将深层特征抽象的特征信息和浅层特征具象的位置信息相结合得到CT 图像的分割掩膜。实验结果表明,该方法对肺结节的检测效果良好。相似文献

15.

基于生物视觉感知的场景特征提取方法

陈硕吴成东陈东岳楚好《东北大学学报(自然科学版)》2011,32(9):1217-1220,1228

针对复杂背景环境下图像场景理解及分类中遇到的诸多难题,提出了一种模拟生物视觉感知的新的图像场景特征提取方法.该方法采用方向、颜色和亮度三种感知特征来构造视觉显著图,并对基本单元进行最大化处理来得到更加精确的方向信息.为了提高特征提取的速度,设计了区域分割算法,然后构造分割区域描述子,最后通过SVM对特征向量集合进行无监督分类以实现显著区域匹配.与传统方法相比,该方法提取的特征对于一定程度的仿射和光照变化具有良好的不变性,同时具有较好的分类效果.实验结果表明上述方法能够较好地应用于场景分类及检索,并具有较强的时效性. 相似文献

16.

基于深度学习的景观植物颜色特征提取方法

林开颜牛程远张浩平杨学军《科学技术与工程》2024,24(17):7059-7065

景观植物的颜色特征及其变化规律可以为植物景观季相分析和设计提供科学依据,但传统的色彩量化分析工作量大且获得的色彩特征准确度低,分析结果易受主观因素影响。针对以上问题,基于UNet++深度学习网络框架,提出一种改进的图像分割模型：在UNet++网络中添加了嵌有注意力机制模块和空洞卷积的全新编码器以增强对植株细节信息的捕捉。提取分割后植株图像在各颜色空间的色彩特征分量,利用Relief算法对12种颜色特征进行筛选。在建立的景观植株数据集上验证改进模型的有效性,实验结果表明：改进模型分割结果的准确率为97.8%,经过筛选分析得到Lab颜色空间内的a通道特征可以作为衡量景观植株随季节变化最有区分度的颜色指标。改进后的模型和特征筛选方法可以为景观植株的季相变化研究和农业作物的特征获取提供技术支撑。相似文献

17.

一种非监督道路场景分割方法 总被引：1，自引：0，他引：1

张浩峰业巧林赵春霞杨静宇《南京理工大学学报(自然科学版)》2012,36(2):232-237

针对道路场景分割中训练样本量大、不同类型道路过渡中易产生误分割的问题,该文提出了一种非监督的道路场景分割方法。首先用K均值聚类对第一幅图像进行初始化分割,再用图割法对其进行能量最小化的优化分割,最后用优化后的分割图像重新计算类别中心,用于指导下一帧图像的图割优化分割。实验表明,该方法无需大量训练样本,可以快速地对道路场景进行分割,还能够在不同的道路类型过渡过程中保持很好的分割效果。相似文献

18.

基于深度学习的输变电设备紫外放电光斑分割方法

裴少通杨家骏马子儒刘云鹏《科学技术与工程》2022,22(33):14759-14766

随着紫外成像技术的发展,高压电力设备对于紫外成像图谱的量化分析提出了更高的要求。紫外图谱的量化分析需要用到除紫外成像仪所输出“光子数”额外的紫外光斑图像信息,所以需要将紫外放电光斑从可见光的背景中分割出来。然而,传统紫外图谱光斑分割方法仍存在复杂背景及小光斑分离困难、特征选取复杂、分割精准度低等问题。基于上述问题,提出了一种基于深度学习的紫外图谱光斑分割提取的方法。首先,采用紫外成像仪拍摄电力设备放电缺陷紫外图谱;其次,分别构建FCN-32s、FCN-16s、FCN-8s 3种全卷积网络(fully convolutional networks, FCN)子模型架构,并利用随机梯度下降法进行模型训练;最后,实现输变电设备放电缺陷紫外图谱主光斑的自主分割提取。经过对FCN 3种子模型架构的训练、测试和对比分析,结果表明：FCN-16s模型为紫外光斑分割提取的最佳模型,测试准确率可达99.34%。结果表明基于深度学习的紫外图谱光斑分割方法准确高效,为紫外光斑的量化提取及电力设备放电缺陷的紫外诊断提供了参考。相似文献