首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 328 毫秒
1.
注意力机制能够挖掘与任务密切相关的重要信息并抑制非重要信息,在语义分割的深层特征表示中发挥着越来越重要的作用。本研究基于广泛应用的U-Net模型,提出了一种基于注意力机制的神经网络模型,针对边缘分割模糊的问题,将U-Net的压缩路径和扩展路径中的双卷积替换为卷积核选择模块,该模块允许网络的每一层根据输入信息进行自适应调整接受野的大小;另外,针对人像分割网络存在不同尺度的全局上下文信息被忽略的问题,采用多尺度预测融合的方法来利用不同尺度的全局信息,并采用双注意力模块汇总空间和通道两方面的注意力信息。大量实验表明,本文中方法的性能与U-Net、UNet++和Attention U-Net等网络相当或更好。  相似文献   

2.
针对桥梁锈蚀数据难获取、锈蚀病害数据集小的问题,基于生成对抗网络(GAN)对桥梁锈蚀数据集进行扩增,并采用IS和K均值聚类算法验证其有效性.采用扩增后的数据集,按4∶1的比例划分为训练集和验证集,分别对U-Net网络和DeepLab-V3+网络进行训练,对比分析2种网络对于锈蚀分割的精度、召回率及F1分数.结果表明,采用深度卷积生成对抗网络(DCGAN)生成虚拟数据集的IS值达到2.41,分类肘形图类别数为5,与原数据集吻合,可作为扩增数据集以提升模型泛化性;DeepLab-V3+网络模型在验证集上的精度为0.935,召回率为0.952,F1分数为0.943,均显著高于U-Net网络模型.DeepLab-V3+网络在点状锈蚀区域连通与分割方面优于U-Net网络,并实现了片状锈蚀区域分割,为桥梁锈蚀精准识别与分割提供了技术支撑.  相似文献   

3.
为了自动精准地分割脉络膜血管以辅助眼科治疗,提出一种基于脉络膜形态拉伸增广(choroid morphology stretch, CMS)结合注意力机制的U-Net框架CMSA-Unet(choroid morphology stretch ATT-Unet).模型先通过数据预处理模块和数据增广模块对原始光学相干断层扫描(optical coherence tomography, OCT)图像进行处理,增强脉络膜的形态特征,并扩充有限的数据集;再在每个编码器中设置卷积注意力模块(convolutional block attention module, CBAM),使模型关注目标分割区域,提升分割效果.消融实验表明,CMS可增强脉络膜特征,CMS结合CBAM模块能有效提高模型对脉络膜血管的分割效果,其IoU、F1分数、灵敏度分别比基线模型U-Net提高了2.9%、2.0%、5.6%.相较于同类模型,CMSA-Unet准确率更高,更适用于脉络膜分割任务.  相似文献   

4.
文章提出了一种提升上下文依赖关系的增强语义分割网络模型PS-UNet实现医学图像分割. PS-UNet将残差块、PCA模块和SPP模块融合到U-Net网络模型中,可获取更多的特征信息,从而提升分割效果.该模型既可以对器官轮廓粗分割又可以对视网膜血管和细胞精细分割.在公开的数据集上分别对肺部、视网膜血管和细胞分割进行了测试.实验结果表明,与当前先进网络模型相比,PS-UNet在所有实验中,性能均有所提升,其中肺部分割中准确率和灵敏度相对于U-Net网络模型分别提高了2.03%和2.24%,Dice相似系数达到了97.16%.  相似文献   

5.
心脏核磁共振成像(MRI)具有噪声多、背景和目标区域相似度高、右心室形状不固定、呈月牙形或扁圆形等特点,虽然基于卷积神经网络的U型结构在医学图像分割中表现出色,但由于卷积本身的局部运算特性,提取全局信息特征能力有限,所以很难提升在心脏MRI上的分割精度.针对上述问题,提出一种全局和局部信息交互的双分支网络模型(UConvTrans).首先,利用卷积分支和Transformer分支提取局部特征和建模全局上下文信息,能够保留细节信息并抑制心脏MRI中噪声和背景区域的干扰.其次,设计了融合卷积网络和Transformer结构的模块,该模块将二者提取的特征交互融合,增强了模型表达能力,改善了右心室的分割精度,而且避免了Transformer结构在大规模数据集上预训练,可以灵活调节网络结构.此外,UConvTrans能有效地平衡精度和效率,在MICCAI 2017 ACDC数据集上进行验证,该模型在模型参数量、计算量仅为U-Net的10%、8%的情况下,平均Dice系数比U-Net提高了1.13%.最终,在其官方测试集上实现了右心室92.42%、心肌91.64%、左心室95.06%的Dice系数...  相似文献   

6.
针对U-Net图像分割在下采样过程中会丢失过多信息且在上采样过程恢复效果不佳,从而导致图像分割精度降低的缺陷,提出了一种基于多层次自注意力机制的U-Net图像分割算法。该多层次自注意力机制在每一层上采样层前均嵌入自注意力模块,将上采样层的输入与缩放的原图拼接后处理成模板图,再与原本的输入信息融合后输出到上采样层。该算法不仅能通过拼接原图的自注意力模块进一步提供更多细节信息,还能利用上采样层的特征选择功能减少拼接原图带来的背景噪音,提高模型的分割精度。最后,在PASCAL VOC数据集和DeepFashion2数据集的基础上进行了人体分割和服装分割实验。实验结果 证明,该方法 能较好地改善图像的分割性能,从而证明了其正确性和有效性。  相似文献   

7.
针对基于图像的疲劳裂纹检测方法精度受焊缝、涂层等复杂背景因素影响较大的问题,提出了一种基于深度学习的空洞金字塔注意力网络(APA-Net)模型用于疲劳裂纹分割.在传统编解码网络的基础上引入预训练ResNet34模型、密集空洞卷积(DAC)模块、尺度感知金字塔融合(SAPF)模块和注意力门控(AG)机制,极大地提升了模型提取多尺度上下文信息的能力.通过图像裁剪制作了包含多种干扰因素的钢箱梁疲劳裂纹分割数据集,然后利用该数据集对APA-Net,FCN,U-Net,Attention U-Net,U-Net++和CE-Net等经典网络进行测试,结果表明:所提出的APA-Net在复杂背景干扰下对钢箱梁表面图像中的疲劳裂纹提取能力最佳,分割结果的平均交并比达72.2%,比其他经典网络中表现最优的CE-Net的平均交并比提高了约4%.最后通过消融实验讨论了所提模块对裂纹分割精度的影响.  相似文献   

8.
郑嘉颖  王杰  付攀  李桢  边桂彬 《科学技术与工程》2023,23(29):12620-12627
为解决样本分布不均衡的连续动作序列分割识别精度不高的问题,提出一种基于深度学习的新型连续动作分割与识别模型,该模型能够从多维时间序列中提取更丰富全面的动作特征。使用基于双向长短时记忆网络(bidirectional long short-term memory networks, Bi-LSTM)的特征提取单元提取数据特征,利用基于注意力机制的特征融合模块融合多种模态的特征,并利用全连接层构建的解码器完成最终分类。实验中使用多种传感器采集了眼科手术中连续环形撕囊操作的连续动作多模态数据对算法进行验证实验。实验结果显示,与使用长短时记忆网络(LSTM)和门控循环单元(gated recurrent unit, GRU)的数据层融合算法以及4种特征层融合策略相比,所提出的模型具有更好的性能。对于数据量最小的动作类别,该算法的识别精度提高了14%以上,全局F1分数提升8%以上,整体识别准确度达到90.72%。这些结果表明,该模型能够有效解决样本分布不均衡的连续动作序列分割识别精度问题,并为多模态连续动作分割与样本不均衡问题的解决提供了新的思路和方法。  相似文献   

9.
针对病变视网膜血管结构的计算机辅助诊断问题,提出了一种多尺度卷积核U-Net模型的视网膜血管分割方法.在U-Net模型基础上设计了融合Inception模块和最大索引值上采样方法的多尺度卷积神经网络结构.在网络训练阶段,采取旋转、镜像等操作进行数据集扩充,运用CLAHE算法进行图像预处理;训练后得到的双通道特征图,进行Softmax归一化;最后通过改进的代价损失函数对归一化结果迭代优化,得到完整的视网膜血管分割模型.实验结果表明,所提方法在DRIVE数据集上分割的准确率达到0.9694,灵敏性达到0.7762,特异性达到0.9835,比U-Net模型具有更优的分割效果和泛化能力,与其他现存方法相比具有一定的竞争力.  相似文献   

10.
徐武  沈智方  范鑫豪  刘洋  徐天奇 《应用科技》2024,(2):99-104+119
临床医生可通过观察眼底视网膜血管及其分支对人体是否患有疾病进行早期诊断,但由于视网膜中的血管错综复杂,模型在分割时会出现对微细血管分割精确度不足的问题。为此,提出一种结合残差模块Res2-net以及高效通道注意力机制(efficient channel attention,ECA)的D-Linknet模型。首先,利用Res2-net代替基础模型中的残差模块Res-net以提升每个网络层的感受野;其次,在Res2-net中添加一种结合压缩激励(squeeze and excitation,SE)和门通道(gated channel transformation,GCT)的注意力机制模块,改善处于复杂背景下的血管分割效果和效率;在网络的解码层加入ECA确保模型计算的性能,避免因降维导致的精度下降;最后,融合改进的模型输出图与掩膜图细化分割结果。在公开数据集DRIVE、STARE上进行分割实验,模型准确度(accuracy,AC)分别为97.11%、96.32%,灵敏度(sensitivity,SE)为84.55%、83.92%,曲线下方范围的面积(area under curve,AUC)...  相似文献   

11.
视网膜血管复杂且背景与视杯视盘区域相似,是造成视杯视盘分割精度不高的原因。为了更加准确地分割视杯视盘,设计了一种具有双支路特征融合的分割网络。网络主支使用Transformer对特征进行提取,弥补了卷积运算在建立远程关系方面存在的不足。采用多个模块来融合浅层空间特征与高级语义特征:尺度感知-特征融合模块(SCA-FFM)用于从高层次特征中收集视盘和视杯的语义和位置信息;识别模块(IM)利用注意力机制减少低层次特征中存在的错误信息和噪声,增强空间细节特征的提取;使用图卷积域-特征融合模块(GCD-FFM)将高级语义特征和低级特征进行融合,使特征图同时具有全局和局部信息。对比实验表明,本文方法表现出更好的分割效果,且具备良好的泛化能力。  相似文献   

12.
针对视网膜黄斑病变数据集缺失以及视网膜图像冗余度过大问题,建立了包含3种视网膜病变的视网膜黄斑疾病检测数据集,并提出了一种基于改进YOLOV5的视网膜病变检测模型.该模型在特征提取网络中引入了改进的注意力机制模块,突出病变区域,降低视网膜图像中大量背景的影响.其次,改进加强特征提取网络,加权融合具有大量细节信息的浅层特...  相似文献   

13.
针对视网膜血管分布复杂且多变,提出一种基于上下文特征提取的视网膜血管分割算法。首先通过霍特林变换(Karhunen-Loeve, K-L)生成灰度图并经过预处理增强对比度。然后经过局部信息熵进行采样。该网络编码部分的多感受野残差编码模块在兼顾速度的同时对特征进行充分的提取。同时底部的特征融合模块由非对称融合非局部模块和非对称金字塔非局部模块两部分组成,用于融合图片的上下文特征。而解码部分由多个微型U型网络组成,保证将底层特征和高层映射特征有效融合并进行深层次的再提取。本文算法在血管分割的数字视网膜图像数据集(digital retinal image for vessel extraction, DRIVE)数据集进行仿真,准确率为96.45%,特异性为98.37%,敏感度为82.7%,实验结果表明能有效地分割视网膜血管。  相似文献   

14.
针对现有的皮肤镜图像分割算法存在边缘分割时效果较差和对中小目标的识别能力较弱等问题。本文提出了一种基于多尺度注意力融合的分割网络MAU-Net(Multi-scale attention U-Net)。MAU-Net网络是以U-Net网络为基础的分割模型,通过本文设计的多尺度注意力模块(MA),在特征提取时融合不同层次的特征,并将重要的目标特征给与一定的权重,从而使网络能更快和更精准的分割出目标区域。实验结果显示,在ISIC2017数据集上平均交并比(MIOU)、精确度(PRE)和kappa值分别为83.61%、93.58%和81.70%,性能比U-Net分别提高了5.27%、2.01%和6.83%;并在ISIC2017挑战赛数据集上进行了消融实验,实验结果验证了MA模型有助于网络性能的提升。本文提出的MAU-Net网络在皮肤病变分割任务中表现优异,同时具有良好的泛化性能。  相似文献   

15.
针对糖尿病视网膜眼底病变多类分割难及小病灶识别率低的问题,提出一种融合注意力机制与改进型DeepLabV3+的糖尿病视网膜眼底病变多类病症分割方法.该方法首先通过使用MobileNetV2网络提取病灶特征,减少参数量并提高算法训练速度;接着通过优化空洞空间卷积金字塔池化中的空洞卷积层数与空洞率,以提高捕获小病灶特征的能力;然后基于DeepLabV3+网络模型进行改进,借助坐标注意力机制感知病灶方向和位置信息,从而提高识别精度;最后采用FGADR和IDRiD数据集分别训练和测试所提出的模型.实验结果表明:所提出方法的平均交并比(MIoU)指标为73.75%,具有较高的分割精度,验证了模型有效性.  相似文献   

16.
针对现有算法因视网膜图像中血管细小和光照等因素导致的分割精度低的问题,在U-Net的基础上进行改进,提出了一种能够较好地提取血管结构的算法模型ASR-UNet。首先,在编码和解码阶段使用了SE-Resnet结构,引入通道注意力机制对血管细微结构进行通道增强,之后在跳跃连接部分使用了AG模块对血管细微结构进行空间增强,提高网络模型对血管细微结构的分割能力。在公开数据集DRIVE和CHASE_DB1上验证了本文的算法,在评价指标Acc上分别为0.969 7和0.965 7,在敏感性上分别为0.804 4和0.767 3,在特异性指标上为0.985 9和0.986 6。实验结果表明,近年来的视网膜血管分割算法相比,本文提出的算法在性能有更好的表现。  相似文献   

17.
针对现有基于字词联合的中文命名实体识别方法会引入冗余词汇干扰、模型网络结构复杂、难以迁移的问题,提出一种基于多头注意力机制字词联合的中文命名实体识别算法.算法采用多头注意力机制融合词汇边界信息,并通过分类融合BIE词集降低冗余词汇干扰.建立了多头注意力字词联合模型,包含字词匹配、多头注意力、融合等模块.与现有中文命名实体识别方法相比,本算法避免了设计复杂的序列模型,方便与现有基于字的中文命名实体识别模型结合.采用召回率、精确率以及F1值作为评价指标,通过消融试验验证模型各个部分的效果.结果表明,本算法在MSRA和Weibo数据集上F1值分别提升0.28、0.69,在Resume数据集上精确率提升0.07.  相似文献   

18.
主流网络在提取图片特征过程中易受其他目标干扰导致特征鲁棒性降低,而现有的基于噪声抗干扰机制有着伪特征与真实特征相似度不高这一劣势;注意力机制的运用可以提升道路场景特征的空间上下文关系从而增强特征的抗干扰能力,但现有的注意力机制缺乏像素级的特征筛选。针对上述问题提出了基于图像特征自干扰与像素注意力机制的道路分割网络,该网络分为主干分割网络和特征自干扰网络两部分,主干的分割网络包含像素注意力模块,可实现真实特征的提取和像素级的增强;自干扰网络输入原始图像随机裁剪和插值放大后得到的局部图生成伪特征,此外提出了融合模块用于实现伪特征与真实特征的融合并对主分割网络中间特征进行干扰。在KITTI和Cityscapes道路数据库上的实验表明:基于图像特征自干扰与像素注意力机制的分割方法与DeepLab V3分割方法相比,在KITTI数据集上的分割精度由88.02%提升至90.55%,在Cityscapes数据集上的分割精度由87.15%提升至90.16%。  相似文献   

19.
采用加强特征提取网络为MobileNetV2的融合多特征金字塔场景解析网络(PSPnet)来实现复杂场景下的图像语义分割.相对于深度残差网络ResNet50和MobileNetV1,引入了线性瓶颈结构和反向残差结构,利用金字塔池化模块(PPM)来处理不同层级的图像特征信息,并将其进行特征拼接,有效避免了不同分割尺寸下,子区域之间关键特征信息的缺失.在此基础上,引入注意力机制模块,结合通道注意力机制(CAM)和空间注意力机制(SAM),进一步提高分割精度.实验结果表明:该方法可以提高图像识别的准确率,并节省训练时间.  相似文献   

20.
针对基于卷积神经网络的行人重识别算法全局信息建模不足的问题,分析了卷积操作的局限性,提出一种基于Transformer改进的全局-局部两分支行人重识别算法.首先利用相对位置编码改进多头自注意力机制,并将其嵌入到Resnet50骨干网络中.之后在全局分支中对图像进行空间几何划分并利用Transformer的全局感受野增强抽象特征的提取能力;在局部分支中对Layer_3输出进行降维监督,利用多尺度池化获得更丰富的局部特征.实验结果表明,该算法在公开数据集Market-1501和DukeMTMC-reID上的mAP/Rank-1分别达到了93.45%/95.61%和88.79%/90.35%,相对于单纯基于卷积神经网络的算法,本文算法达到更高的精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号