首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 945 毫秒
1.
在目前基于深度学习的单目图像深度估计方法中,由于网络提取特征不够充分、边缘信息丢失从而导致深度图整体精度不足。因此提出了一种基于多尺度特征提取的单目图像深度估计方法。该方法首先使用Res2Net101作为编码器,通过在单个残差块中进行通道分组,使用阶梯型卷积方式来提取更细粒度的多尺度特征,加强特征提取能力;其次使用高通滤波器提取图像中的物体边缘来保留边缘信息;最后引入结构相似性损失函数,使得网络在训练过程中更加关注图像局部区域,提高网络的特征提取能力。在NYU Depth V2室内场景深度数据集上对本文方法进行验证,实验结果表明所提方法是有效的,提升了深度图的整体精度,其均方根误差(RMSE)达到0.508,并且在阈值为1.25时的准确率达到0.875。  相似文献   

2.
针对传统卷积神经网络随着深度加深而导致网络退化以及计算量大等问题,提出一种改进残差神经网络的遥感图像场景分类方法。该方法以残差网络ResNet50作为主框架,在残差结构中引入深度可分离卷积和分组卷积,减少了网络的参数量和计算量,加快模型收敛的同时也提升了分类精度。此外在网络中嵌入多尺度SE block模块对通道特征进行重校准,提取出更加重要的特征信息,进一步提升了网络的分类性能。在AID和UCMerced_Land Use两个公开数据集上的分类精度分别为91.92%和93.52%,相比常规残差网络分类精度分别提高了3.38%和10.24%,证明所提方法在遥感图像场景分类任务中的可行性和有效性。  相似文献   

3.
马永忠  夏保丽 《广西科学》2023,30(1):139-148
针对现有僵尸网络检测方法检测精度不高和检测时间开销较大的问题,提出一种基于改进Transformer和强化学习的僵尸网络域名生成算法(Domain Generation Algorithm,DGA)的域名检测方法。首先,利用深度可分离卷积替换ResNet和ResNeXt网络中的卷积块,通过减少网络模型参数来降低模型的时间开销;其次,利用改进后的ResNet和ResNeXt网络将域名字符串映射到深度特征空间,构造多尺度特征,强化特征的表达能力;再次,利用长短期记忆神经网络(Long Short-Term Memory,LSTM)对Transformer网络进行改进,在保持字符间相对位置的同时,进一步建立上下文的长距离依赖编码,并在此基础上引入注意力机制,强化模型对关键特征的捕获能力;最后,引入强化学习对模型进行微调,提高DGA域名的检测精度。在多个DGA域名数据集上进行测试验证,结果表明该模型在保持检测时间开销较小的基础上,具有更高的检测精度。  相似文献   

4.
研究提出一种面向自动驾驶的多模态信息融合的目标识别方法,旨在解决自动驾驶环境下车辆和行人检测问题。该方法首先对ResNet50网络进行改进,引入基于空间注意力机制和混合空洞卷积,通过选择核卷积替换部分卷积层,使网络能够根据特征尺寸动态调整感受野的大小;然后,卷积层中使用锯齿状混合空洞卷积,捕获多尺度上下文信息,提高网络特征提取能力。改用GIoU损失函数替代YOLOv3中的定位损失函数,GIoU损失函数在实际应用中具有较好操作性;最后,提出了基于数据融合的人车目标分类识别算法,有效提高目标检测的准确率。实验结果表明,该方法与OFTNet、VoxelNet和FasterRCNN网络相比,在mAP指标白天提升幅度最高可达0.05,晚上可达0.09,收敛效果好。  相似文献   

5.
为了有效改善现有人脸表情识别模型中存在的信息丢失严重、组件间相对空间联系不密切的问题,提出了一种改进的多尺度卷积神经网络模型,通过构建深层多尺度卷积神经网络,使模型能够挖掘出更多潜在的特征信息;通过特征融合促进信息的流通和重利用,减少池化操作所引起的重要信息丢失,使得模型具有更好的学习能力;通过控制每层多尺度卷积神经网...  相似文献   

6.
针对高压管汇损伤需要提高检测效率和准确率的问题,提出一种基于多尺度一维卷积神经网络(multi-scale one-dimensional convolutional neural network, MS-1DCNN)的弯管冲蚀损伤智能检测新方法,即用多尺度卷积层代替传统的单一尺度卷积层。在MS-1DCNN模型中,把通过模拟实验所得弯管冲蚀损伤原始时域信号作为多尺度一维卷积神经网络的输入,这样能解决传统方法依赖人工提取特征和专家知识的问题;然后,通过多尺度卷积层和池化层的交替连接对输入信号进行特征提取;最后,经由输出层输出弯管冲蚀损伤分类结果。模型试验结果表明:基于MS-1DCNN弯管冲蚀损伤检测方法可以有效检测出弯管冲蚀损伤,且平均检测准确率达到99.18%。研究可为高压管汇冲蚀损伤智能检测提供一种新思路。  相似文献   

7.
针对传统基于机器学习损伤识别方法手工提取特征适应性差、识别能力弱等问题,提出一种基于卷积神经网络和迁移学习的新颖、快速结构损伤识别方法.首先根据损伤特征向量特点,提出原始信号的分帧处理流程;其次考虑多传感器数据融合要求,建立多通道一维卷积神经网络结构损伤识别模型,给出模型的整体流程和网络参数;然后采集不同通道和不同噪声水平下,模拟不同位置程度损伤的15层框架数值模型加速度数据,进行损伤识别;最后将网络模型进行迁移学习,对7层框架模型试验进行损伤识别,并验证所提方法的可行性、准确性和计算复杂性.结果表明,该方法实现了特征自适应提取、损伤位置和损伤程度的精准识别,具有突出的计算效率.  相似文献   

8.
提出一种以U-Net为基础,依据零件缺陷的特点对网络进行一系列改进的模型,以提升网络对零件缺陷的分割精度.首先在U-Net结构中的编码阶段,使用改进的残差网络Res2Net提高该阶段的特征提取能力;然后在网络编码器与解码器的中间部位增加空洞卷积,在不改变特征图尺寸的情况下增加感受野,降低误检率与漏检率;最后在U-Net的输出阶段与Mini U-Net进行结合,对原本的输出结果进行二次补丁,提高对微小缺陷的检测精度.实验结果表明,对MVTec数据集进行分割的F1-Score分数达到87.21%,时间为0.017 s,达到了良好的检测效果.  相似文献   

9.
鞋印图像识别是计算机视觉在公安一线工作中的一项重要应用。当前公安侦查工作中鞋印图像无法进行精准识别的问题制约了工作效率与质量的提高,归纳起来主要是囿于鞋印现场提取的复杂情况、鞋印花纹图样的复杂特征以及鞋印图像的残缺不全。针对残缺鞋印,为了进一步提高残缺鞋印检索结果,设计了一种融合特征筛选的双塔网络鞋印检索算法。一方面,在网络中引入分区策略,将鞋印图像分为足掌区和足跟区用两个特征网络分别提取图像特征进行融合;另一方面,选择融合ResNet网络和Transformer网络的新型卷积神经网络convNeXt网络作为骨干网络,加入注意力机制模块,提取最后一层卷积特征后用不同的特征筛选方法去除鞋印图像中的无关特征,最后拼接展开成为特征描述符进行相似度计算。在训练阶段,优化学习策略,将其作为完整的图像分类网络进行训练。实验结果表明,本文选取的网络模型优于其他卷积神经网络,在CSS-200和FID-300两个鞋印数据集上取得了较高的准确率。  相似文献   

10.
近年来提出的多示例学习算法在一定程度上能够克服模板漂移问题。然而,在线学习需要获取足够多的有用数据才能达到稳定的追踪效果,但是这却增加了算法的复杂度。为了解决这一问题,在压缩感知理论的基础上,运用随机观测的方法对多尺度图像特征进行降维,提取的这些低维特征中包含大量的有用信息。因此,我们提出的算法是先利用压缩感知理论提取目标特征之后,再使用在线多示例学习算法分类器对这些特征进行分类从而实现目标的稳定跟踪。通过对不同的图像序列进行实验,结果表明基于压缩感知的在线多示例学习算法对实时的目标追踪有很好的适应性。  相似文献   

11.
为了解决传统雄穗检测方法因玉米品种不同以及田间环境不同导致的检测误差较大、鲁棒性较差的问题,利用深度卷积神经网络提取特征,并对多尺寸特征图卷积的方法检测玉米雄穗。采用深度卷积神经网络inception作为基础网络来训练提取玉米雄穗特征,同时增加额外的卷积层对图像进行卷积提取特征,最后分别对基础网络中的两层卷积层以及额外的卷积层卷积得到的不同尺度特征图进行分类和位置回归。整体网络结构是多尺度端到端框架,效率高,方便检测不同尺度的雄穗。实验结果表明,此方法提高了雄穗检测的速度和准确率。  相似文献   

12.
在小目标物体检测、多类别物体检测尤其是轻量化检测模型等关键技术研究方面仍面临较大的挑战,基于此,本文提出一种轻量化自适应特征选择目标检测网络.该网络以特征金字塔为基础,提取多尺度图像特征并从空间维度上对特征图进行滤波,从通道维度上自适应地选择特征图中更重要的通道,降低多通道下噪声和干扰对目标特征的稀释作用,减少特征图在传递过程中的信息丢失.除此之外,构建深度可分离卷积的分类网络,降低后续处理的计算量,加快检测速度,实现网络的轻量化处理.在PASCAL VOC 2007数据集上的检测平均精度为77.7%,检测速度为14.3帧/s.在MS COCO数据集上的测试结果表明,该网络在精度损失小于5%的情况下,检测速度远超FPN,比Mask R-CNN可以更好地兼顾检测速度和检测精度.  相似文献   

13.
针对遥感图像中的小目标存在信息少、易受背景干扰、特征表达较弱等缺陷, 导致目前通用目标检测算法在对这类小目标进行检测时效果不理想的问题, 为提高对遥感图像中小目标的检测能力, 提出一种基于RFBNet的改进算法. 该算法以RFBNet为框架, 首先利用自校正卷积取代特征提取网络中的常规卷积, 以扩展感受野丰富输出, 进而强化对弱特征的提取能力; 然后设计多尺度特征融合模块, 丰富浅层特征图的抽象信息; 最后设计稠密预测模块, 提前在较浅层整合上下文信息, 使最后阶段的每层输出都含有丰富且联系紧密的多尺度特征信息. 将该算法在数据集UCAS_AOD和NWPU VHR-10上进行实验, 平均检测精度分别达83.4%和94.8%. 实验结果表明, 该算法有效提高了遥感图像中目标检测的精度, 且针对遥感图像中的小尺度目标检测问题改善明显.  相似文献   

14.
针对目前利用人脸特征进行性别和年龄识别率较低的问题, 提出一种基于改进高分辨率网络(improved high-resoultion net, IHRNet)的新方法. 首先, 在IHRNet中融合具有少量参数和较高识别率的MobileNetV3结构, 结合高分辨率网络自身具有的多尺度特征提取优势, 有效提升了人脸特征识别的准确率; 其次, 为降低过拟合风险, 网络先采用IMDB-WIKI人脸数据集进行预训练, 然后加载预训练模型在Adience人脸数据集中进行训练和测试; 最后, 与ResNet50,HRNet,MobileNetV3三种同类算法进行对比. 实验结果表明, IHRNet在年龄及性别识别上的准确率分别高达82%,95%, 比同类算法分别平均提升9%和3%, 且参数量较未改进时下降36%, 验证了改进算法的有效性.  相似文献   

15.
针对目前利用人脸特征进行性别和年龄识别率较低的问题, 提出一种基于改进高分辨率网络(improved high-resoultion net, IHRNet)的新方法. 首先, 在IHRNet中融合具有少量参数和较高识别率的MobileNetV3结构, 结合高分辨率网络自身具有的多尺度特征提取优势, 有效提升了人脸特征识别的准确率; 其次, 为降低过拟合风险, 网络先采用IMDB-WIKI人脸数据集进行预训练, 然后加载预训练模型在Adience人脸数据集中进行训练和测试; 最后, 与ResNet50,HRNet,MobileNetV3三种同类算法进行对比. 实验结果表明, IHRNet在年龄及性别识别上的准确率分别高达82%,95%, 比同类算法分别平均提升9%和3%, 且参数量较未改进时下降36%, 验证了改进算法的有效性.  相似文献   

16.
针对传统卷积神经网络(CNN)稀疏的网络结构无法保留全连接网络密集计算的高效性和在实验过程中卷积特征利用率低造成的分类结果不准确或收敛速度较慢的问题,提出了一种基于CNN的多尺度方法结合反卷积网络的特征提取算法(MSDCNN)并对腺癌病理图像进行分类。首先,利用反卷积操作实现不同尺度特征的融合,然后利用Inception结构不同尺度卷积核提取多尺度特征,最后通过Softmax方法对图像进行分类。在腺癌病理细胞图像进行的分类实验结果表明,在最后的卷积特征尺度相同的情况下,MSDCNN算法比传统的CNN算法分类精度提高了约14%,比同样基于多尺度特征的融合网络模型方法分类精度提高了约1.2%。  相似文献   

17.
庄建军  石潇愉 《科学技术与工程》2023,23(36):15538-15544
网购时代,五花八门的产品品牌让消费者选择困难,同时也滋生了大量线上商标侵权行为。为此,提出一种基于深度学习的商标检测方法。方法以YOLOv7-tiny网络模型为基础,首先,为提升多尺度检测能力,Neck部分的PAnet模块改为简化的自适应学习权重、多尺度特征融合网络SimBiFPN;接着,为关注关键语义信息,引入注意力机制,将Neck与Head间的卷积层Conv改为全维度动态卷积ODConv;最后,为了使算法具有像素级建模能力,将激活函数改为FRelu。选择天池平台数据集经Mosaic和Mixup数据增强后完成模型的训练与验证。结果表明:改进模型的mAP达到85.84%,较原始模型提升了近2个百分点,优于其他YOLO(you only look once)模型,且模型的参数量下降41%。所提方法有助于提高用户的在线购物效率,同时可加强商标侵权的打击力度。  相似文献   

18.
为解决立体匹配网络模型轻量化与高精度不能共存的问题,本文提出新的立体匹配算法CSA-Net。算法具体是在特征提取阶段,利用类ResNet进行特征提取,训练空洞金字塔池化(ASPP)模块扩大感受野,提取多尺度上下文信息,加入联合注意力机制(CSM),在空间和通道维度提高表征能力,关注重要特征并抑制不必要的特征。在特征融合阶段,将2D深度可分离卷积提升到3D来代替原网络中标准3D卷积在空间维度和通道维度分别进行卷积运算,以降低特征融合网络的参数量与模型运行时间。最终实验表明,本文所提出的立体匹配网络模型在KITTI 2012和2015数据集进行验证,在三像素匹配误差率为1.44%和2.24%,模型运行时间减少近1/3。因此,相比于其他实现了更高的匹配精度和更快的运行速度。  相似文献   

19.
目的 估计获取拍摄物体到相机之间距离的深度信息是单目视觉 SLAM 中获取深度信息的方法,针对无监督 单目深度估计算法出现精度不足以及误差较大的问题,提出基于多尺度特征融合的混合注意力机制的连续帧深度 估计网络。 方法 通过深度估计和位姿估计的两种编码器解码器结构分别得到深度信息和 6 自由度的位姿信息,深 度信息和位姿信息进行图像重建与原图损失计算输出深度信息,深度估计解码器编码器结构构成 U 型网络,位姿 估计网络和深度估计网络使用同一个编码器,通过位姿估计解码器输出位姿信息;在编码器中使用混合注意力机 制 CBAM 网络结合 ResNet 网络提取四个不同尺度的特征图,为了提升估计的深度信息轮廓细节在提取的每个不 同尺度的特征中再进行分配可学习权重系数提取局部和全局特征再和原始特征进行融合。 结果 在 KITTI 数据集 上进行训练同时进行误差以及精度评估,最后还进行了测试,与经典的 monodepth2 单目方法相比误差评估指标相 对误差、均方根误差和对数均方根误差分别降低 0. 034、0. 129 和 0. 002,自制测试图片证明了网络的泛化性。 结论 使用混合注意力机制结合的 ResNet 网络提取多尺度特征,同时在提取的特征上进行多尺度特征融合提升了深度 估计效果,改善了轮廓细节。  相似文献   

20.
针对目前负荷分解模型的深层负荷特征提取不充分,分解精度低以及训练成本高等问题,提出了一种多尺度特征融合模型。模型由负荷分解子网络及负荷识别子网络两部分构成,两个子网络均利用一维卷积和批量归一化等组成的卷积块进行负荷特征初提取,然后采用金字塔池化模块从多个维度精确提取深层负荷特征信息,并与特征初提取部分进行融合。金字塔池化模块使网络参数大大减少且降低了训练成本。同时与以往模型中的注意力机制不同的是,网络引入多头自注意力机制,每个注意力关注负荷特征的不同部分,从多个角度实现对重要负荷特征的筛选,进一步提高分解性能。最后,在UK-DALE和REDD数据集上进行实验,结果表明所提模型与四个基准模型相比,无论是负荷分解性能还是电器运行状态识别能力都有明显提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号