共查询到19条相似文献,搜索用时 62 毫秒
1.
针对细粒度图像分类中数据分布具有小型、非均匀和不易察觉类间差异的特征,提出一种基于注意力机制的细粒度图像分类模型.首先通过引入双路通道注意力与残差网络融合对图像进行初步特征提取,然后应用多头自注意力机制,达到提取深度特征数据之间细粒度关系的目的,再结合交叉熵损失和中心损失设计损失函数度量模型的训练.实验结果表明,该模型在两个标准数据集102 Category Flower和CUB200-2011上的测试准确率分别达94.42%和89.43%,与其他主流分类模型相比分类效果更好. 相似文献
2.
针对存在的性格类别数量大的特点,提出了一种性格属性感知的辅助学习方法.首先对细粒度性格类别归纳标注,将其映射到多个粗粒度的性格属性.其次,将细粒度性格推理作为主任务,细粒度性格与粗粒度属性之间的映射作为辅助任务.最后,通过辅助学习机制联合学习两个任务.实验结果表明,提出的方法在细粒度性格推理任务上推理性能显著优于其他基... 相似文献
3.
细粒度图像分类是对传统图像分类的子类进行更加细致的划分,实现对物体更为精细的识别,它是计算机视觉领域的一个极具挑战的研究方向。通过对现有的细粒度图像分类算法和Xception模型的分析,提出将Xception模型应用于细粒度图像分类任务。用ImageNet分类的预训练模型参数作为卷积层的初始化,然后对图像进行缩放、数据类型转换、数值归一化处理,以及对分类器参数随机初始化,最后对网络进行微调。在公开的细粒度图像库CUB200-2011、Flower102和Stanford Dogs上进行实验验证,得到的平均分类正确率为71.0%、89.9%和91.4%。实验结果表明Xception模型在细粒度图像分类上有很好的泛化能力。由于不需要物体标注框和部位标注点等额外人工标注信息,Xception模型用在细粒度图像分类上具有较好的通用性和鲁棒性。 相似文献
4.
针对包含细微差异动作的视频数据集,提出了一种用于分辨细粒度差异动作的深度神经网络.该网络结构由一个三维卷积(C3D)网络的轻量化变体和一个基于注意力机制的长短时记忆网络组成,优化了三维卷积网络的深度和注意力机制的权重惩罚项.实验结果表明:该网络可以有效地关注视频中的重要信息,在平均准确率和检测准确率上均有所提升. 相似文献
5.
细粒度图像分类是计算机视觉中非常热的研究方向.由于同一个大物种的子类别之间具有相似的外观,相似的颜色,所以差别非常细微.因此,细粒度图像分类非常具有挑战性.为了解决这个挑战,该文提出一种基于注意机制的循环卷积神经网络用于细粒度图像分类.首先,根据注意机制循环提取一幅图像中的显著性物体区域;然后,对原始图像和每次提取的显著性区域分别进行分类;最后,融合分类层得分,进行最终分类.在非常有挑战性的公共数据集CUB-200-2011,Stanford Dogs和Stanford Cars上进行实验,与比较先进的实验方法进行比较,实验结果表明该文提出的方法非常有效. 相似文献
6.
新冠肺炎在全球范围内的突然爆发,使医疗工作者进入了紧张的工作状态.面临此次突发的危机争件,病毒检测速度较慢,检测手段单一等问题也迅速暁露出来,为此,提出了一种基于注意力机制的轻量级卷积神经网络方法,以进行高效肺部图像分类,从而缓解医疗工作压力.提出模型采用MobileNet为基本网络,并融合注意力机制.实验表明,提出网... 相似文献
7.
知识蒸馏能提高神经网络的泛化能力,可解决遥感图像场景分类时标注数据不足的问题。遥感图像存在的类间高相似性会导致中间知识特征丢失,针对该问题,本文提出一种基于自蒸馏级联注意力机制的特征提取方法(SDCASA)。首先构造权值共享的教师、学生网络;然后使用级联注意力模块精细化深层教师网络所提取到的特征,同时保留被浅层神经网络过滤的中间边缘信息;再利用精细化之后的特征指导学生网络学习;最后在下游训练一个线性分类器完成特征分类。在3个公开数据集AID、MLRSNet、EuroSAT上使用20%和50%的样本训练,分类准确率分别达到85.17%、90.10%、 91.13%和85.50%、92.13%、91.17%。此方法能有效提高遥感图像场景分类准确率,性能优于主流自监督图像分类方法 SimSiam、SwAV、MoCov2、Deepcluster,具有良好的应用价值。 相似文献
8.
细粒度实体分类是一项多类别多标签任务,能协助广泛的下游任务(关系抽取、共指消解、问答 系统等)提高工作效率、优化准确率,已成为自然语言处理领域的一个研究热点。针对传统的细粒度实体分类方法人工标注大型语料库难度大,准确率偏低等问题,研究人员提出了基于神经网络的细粒度实体分类方 法,不仅能够解决人工标注费时费力的问题,而且可以提高分类的准确率。然而现有的神经网络模型大多需 要远程监督的参与,在此过程中会引入噪声标签等问题,通过噪声标签处理方法能够有效抑制噪声标签对分类结果的影响,进一步提升分类性能。 在相同评测数据集下,根据相同评价指标对比各类细粒度实体分类方 法的性能,可以发现在细粒度实体分类领域中采用 BiLSTM 处理实体指称上下文,并通过注意力机制提取更为重要的特征,有助于提高细粒度实体分类方法的准确率、Macro F1值和 Micro F1值。 相似文献
9.
针对现有的大部分细粒度图像分类算法都忽略了局部定位和局部特征学习是相互关联的问题,提出了一种基于集成迁移学习的细粒度图像分类算法。该算法的分类网络由区域检测分类和多尺度特征组合组成。区域检测分类网络通过类别激活映射(class activation mapping,CAM)方法获得局部区域,以相互强化学习的方式,从定位的局部区域中学习图像的细微特征,组合各局部区域特征作为最终的特征表示进行分类。该细粒度图像分类网络在训练过程中结合提出的集成迁移学习方法,基于迁移学习,通过随机加权平均方法集成局部训练模型,从而获得更好的最终分类模型。使用该算法在数据集CUB-200-2011和Stanford Cars上进行实验,结果表明,与原有大部分算法对比,该算法具有更优的细粒度分类结果。 相似文献
10.
卷积算子是卷积神经网络的核心构造块,它根据一定的感受视野,融合卷积神经网络各层与不同通道之间的信息,提取出原始图像特征.然而图像中的相邻像素往往具有相似的值,导致卷积层的输出包含大量冗余信息.为了减少冗余信息,加快模型推理速度,神经网络中会加入池化层进行信息降维.对比传统降维方法,池化本身具有平移和旋转不变性,对图像特... 相似文献
11.
深度估计在医学显微影像中具有重要应用价值,可以弥补外科医生在手术过程中由于观察目镜感官受限而难以获得精确深度信息的不足。针对手术场景动态多变、软组织和手术器械尺度微小等原因导致深度估计精度不高的问题,提出了一种改进稠密回归中跨层级特征级联的深度估计方法。通过利用多层次特征聚合模块,将编码器中的上下文信息传递到解码器中,同时基于通道选择和分支优化的双重注意力特征融合机制来优化解码的精度。为了获得密集的深度真值,提出了一种迭代式配准策略,结合自动化的机械臂扫描实现由粗到精优化多视角点云配准,并从模拟场景中重建高精度深度数据。实验结果表明,本文提出的深度估计方法实现了0.00151的均方误差值(root mean squared error, RMSE)和0.03039的尺度不变对数误差值(scale-invariant log, SILog),超越了以往最先进的方法,并对细小手术器械的尖端产生了更精准的深度估计。 相似文献
12.
在自然场景文本图像超分辨中,针对先验信息利用不准确、不充分以及文本边缘恢复不完整的问题,提出了一种基于文本语义指导的自然场景文本图像超分辨方法。该网络结构由超分辨重建模块和文本语义感知模块组成。为进一步提高超分辨网络的表达能力,提出使用循环十字交叉注意力,捕获全局上下文信息,使得模型在训练的过程中更加关注文本区域,同时,提出软边缘损失、梯度损失对重建过程进行约束,生成具有锐利边缘的超分辨结果。采用公开的自然场景文本图像超分辨数据集TextZoom对提出模型的性能进行验证,与8种主流深度网络模型进行了对比,结果表明:该模型在3个不同识别器下的平均识别率相比TSRN分别提升了2.06%、1.80%和2.89%,在PSNR和SSIM指标上也具有一定的优势。 相似文献
13.
为了降低视频传感器网络中的网络负载,减少能量消耗、降低时延,提出了一种分层的基于注意力模型的多质量图像融合方法.通过对节点的结构化部署及视图间的区域映射,建立了基于动态注意力的节点唤醒机制.通过使用低层节点采集的高质量图像对高层节点低质量图像的融合,使注意力目标得到增强.实验结果证明了该融合方法的有效性. 相似文献
14.
针对红外图像固有噪声和灰度分布非均匀性影响图像质量的问题,提出一种基于引导滤波的红外图像预处理方法。根据引导图的局部信息,在红外图像的不同位置动态生成滤波核函数,从而可以在平滑场景的同时保持甚至增强边缘细节。实验表明,本文方法可以有效滤除噪声,保持场景强边缘,改善灰度分布非均匀性;且由于引导滤波算法复杂度与滤波半径无关,处理速度快。此外,应用实验表明该方法可以提高融合图像视觉效果,增强目标跟踪的定位精度,在图像增强中能够有效避免伪边缘的产生。 相似文献
15.
基于引导滤波的单幅图像去雾算法研究 总被引:2,自引:1,他引:1
基于暗原色先验的单幅图像去雾算法较好地解决了估算雾天场景透射率的问题,算法复原的图像清晰颜色自然。但原始算法计算复杂度高、耗时长、无法满足实时性需求。介绍了引导图像滤波的原理,并将其与暗原色先验结合以改进原始算法;同时分析了滤波参数对去雾结果的影响。实验证明改进的算法在保证原算法去雾效果的同时能使算法复杂度大大降低。 相似文献
16.
为了将标签间的语义相关性引入多标签图像分类模型中,传统的方法例如 ML-GCN 通过设置单阈值将标
签条件概率矩阵二值化为标签共现矩阵,然而,仅设置单阈值很难归纳所有的标签语义关系情况。 针对这一问题,
提出一种融合标签间强相关性的多标签图像分类方法—MGAN(Multiple Graph Convolutional Attention Networks),
通过设置多个阈值,将传统的标签条件概率矩阵按照不同的相关性程度分割为多个子图;同时,为了提升多标签分
类性能,也引入图像区域空间相关性。 另外,针对传统的“CNN+GCN”方法将标签与特征的融合张量视为预测分数
缺乏可解释性问题,将标签与特征的融合张量视为注意力分数;在 MS-COCO 和 PASCAL VOC 数据集上与其他主
流多标签图像分类方法进行了对比实验,平均准确率分别达到了 94. 9%和 83. 7%,相较于经典 ML-GCN 模型,分
别获得了 0. 9%和 0. 8%准确率提升,且在“Binary”和“Re-weighted”邻接矩阵模式下,MGAN 都有较好的表现,验证
了新的融合方法可以缓解图卷积神经网络过平滑问题对多标签图像分类的影响。 相似文献
17.
目的 低光工况或拍摄技巧影响都可能获得低光照图像,为解决此类图像对比度低、噪声大、颜色失真等问题,提出一种卷积神经网络增强模型 RetKIND,包括分解网络、亮度调整网络和降噪网络。 方法 它借助残差模块(RB)和跳跃连接,有效抑制分解网络在分解时产生的噪声;融合 U-Net 架构、空洞卷积和 EBAM 高效注意力机制构建降噪网络,利用空洞卷积扩大感受野,提取更多图像信息,提高 EBAM 在通道和空间上提取反射图的细节、纹理、颜色等特征的能力,实现图像去噪;由 UC(亮度调整网络中的自定义模块)和普通卷积组成亮度调整网络,旨在减少光照图细节缺失,提高光照分量对比度。 融合去噪后的反射分量和增强后的光照分量,得到正常光照图像。结果 仿真结果表明:在 LOL 数据集上,相较 R2RNet,FPSNR 和 FSSIM 值分别上升了 6. 2%和 4. 2%;相较 URetinexNet,FPSNR 和 FSSIM 值分别上升了 5. 9%和 1. 2%;相较 DEANet,FPSNR 和 FSSIM 值分别上升了 2. 9%和 1. 1%。 结论 Ret-KIND 模型既能提升图像亮度,又能降低图像的噪声,有助于推动低光图像增强模型应用到目标检测领域。 相似文献
18.
本研究针对现有图像修复方法不能有效地分离结构和纹理信息,修复结果往往会出现边界模糊、结构扭曲等伪影问题,提出了基于潜在特征重构和注意力机制的人脸图像修复方法。人脸图像修复方法分为两阶段,第一阶段,通过结构重建器网络提取样式向量,按照StyleGAN所述的原理分为粗尺度特征、中尺度特征和精细特征三组,插入到预先训练好的StyleGAN生成器中,产生初步的修复结果;第二阶段通过构建纹理生成网络并使用上下文注意力机制,注意力分数由注意力计算模块计算,注意力转移模块根据较高级别特征图和注意力分数来填充较低级别特征图中的对应缺失区域,以细化上一阶段初步的人脸修复结果。在CelebA-HQ数据集上的训练并进行测试,本文的方法在定量和定性分析两个方面均优于现有方法。因此,基于潜在特征重构和注意力机制的人脸图像修复方法能够有效地修复缺损人脸图像,大大减少了边界过度平滑和存在纹理伪影的问题。 相似文献
19.
传统机器学习方法在进行机械钻速预测时,受复杂特征提取和人为认知局限性的影响,难以满足现场预测精度要求。基于此,提出一种特征提取和回归预测相结合的机械钻速预测方法。首先,采用箱型图和独热编码对钻井实测数据进行预处理,清除异常数据并将离散特征连续化。其次,应用卷积神经网络(convolutional neural network, CNN)挖掘数据特征,并在网络中引入通道注意力机制(squeeze-and-excitation network, SENet),实现对CNN特征通道重要性程度的合理分配,建立SE-CNN机械钻速预测模型。最后,将SE-CNN模型与CNN模型进行对比分析,结果表明:SE-CNN模型的拟合优度提高了2.1%,平均绝对误差和均方根误差分别降低了1.1%和1.5%。SE-CNN模型具有较高的预测精度,可以用于现场机械钻速预测,为钻井提速提供科学参考。 相似文献