首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
随着深度学习技术的发展,基于卷积神经网络的目标检测技术成为当前计算机视觉领域的研究热点之一.目前主流的目标检测算法依赖于监督学习方式,需要在大量有标注图像数据上训练网络,然而,无标签的数据易于获取,而有标签的数据收集起来通常很困难,标注也耗时和耗力.为了解决数据标注难以获取的问题,提出了教师学生互助训练的半监督目标检测(PPYOLOE-SSOD)算法.首先,同时训练一个学生模型和逐渐改进的教师模型,使用教师模型筛选高质量伪标签,将伪标签作为未标注图像的回归目标,指导学生模型训练,挖掘未标注图像的知识信息,为了减小参数传递的不稳定性,每次迭代学生模型使用指数移动平均方法更新教师模型参数;此外,引入不同种类的半监督数据增强方法来增强网络的抗干扰能力;最后,针对无标注数据的学习,新增无监督学习分支,使用密集学习方式对模型预测得到的特征进行处理,通过对教师模型预测的分类特征排序,自动选择高质量特征作为教师模型生成的伪标签,从而避免了繁琐的伪标签后处理,提升网络的精度和训练速度.在MSCOCO数据集上,通过使用半监督学习方法,PPYOLOE在1%、5%、10%的标注数据集上分别得到了1.4%、1...  相似文献   

2.
唐卡是藏传佛教艺术的重要表现形式,其内容丰富、结构复杂、佛元素较多,对其理解与欣赏需要储备大量的唐卡专业知识,而人工对每张唐卡的各种元素进行标注与讲解是一件极为耗时耗力的过程。因此,为了普及和推广唐卡这一特殊艺术类型,本文提出了一种唐卡元素自动检测算法。同时,由于唐卡内容源于绘制创作,存在长宽比例较大等类内差异,而且存在大量角度倾斜,直接应用自然图像检测算法,往往导致检测精度低甚至漏检的问题,本文提出了一种基于改进YOLOv5-Ghost模型的唐卡元素自动检测方法。该方法增加了旋转检测框(RotatedBox),同时用水平检测框和旋转检测框对唐卡元素进行精确检测,在YOLOv5-Ghost模型基础上引入了CSL(Circular Smooth Label)技术,将角度由回归问题转变为分类问题。由于目前在目标检测领域没有标准化的热贡唐卡类数据集以供研究,本文构建了唐卡数据集,并提供了水平标签及旋转目标标签。与传统的YOLOv5以及YOLOv5-Ghost模型相比,实验结果表明,本文算法平均分类精度均值分别提升了16.1%和2.4%,克服了唐卡旋转类元素漏检的状况,使唐卡元素自动检测实现了...  相似文献   

3.
实时的交通场景目标检测是实现电子监控、自动驾驶等功能的先决条件.针对现有的目标检测算法检测效率不高,以及大多数轻量化目标检测算法模型精度较低,容易误检、漏检目标的问题,本文通过改进YOLOv5目标检测算法来进行模型训练,再使用伪标签策略对训练过程进行优化,然后在KITTI交通目标数据集上将标签合并为3类,对训练出的模型进行测试.实验结果表明,改进的YOLOv5最终模型在该所有类别上的mAP达到了92.5%,对比原YOLOv5训练的模型提高了3%.最后将训练的模型部署到Jetson Nano嵌入式平台上进行推理测试,并通过TensorRT加速推理,测得平均每帧图像的推理时间为77ms,可以实现实时检测的目标.  相似文献   

4.
由于高分辨率遥感图像存在目标排列密集、尺寸差别大等情况,传统算法难以准确地对其进行目标检测。在YOLOv3算法的基础上,提出一种改进的高分辨率遥感图像目标检测算法(remote sensing-YOLO,RS-YOLO)。利用K-means聚类算法对数据集进行聚类,重新设计适合遥感图像的先验框; 引入高斯模型计算预测框的不确定度,以提高网络对预测框坐标的准确度; 使用弱化的非极大值抑制算法(soft non-aximum suppression,Soft-NMS)对预测框进行处理,增强算法对密集排列目标的检测能力。实验结果表明,改进后的算法能够对高分辨率遥感图像进行有效的目标检测,以NWPU VHR-10数据集为例,RS-YOLO的平均检测精度达到了87.97%。  相似文献   

5.
为了解决遥感图像中目标密集、目标小车辆检测难的问题,提出基于YOLOv5的改进模型RDB-YOLOv5,并将其首次应用于遥感图像车辆检测领域。首先,针对遥感图像车辆方向任意的问题,对现有基于旋转边界框(rotated bounding box)的目标检测方法环形平滑标签(circular smooth label, CSL)进行改进;其次,针对遥感图像中背景信息复杂,车辆尺寸小导致检测精度降低的问题,提出基于注意力的多尺度目标检测方法,在骨干网络中添加双注意力机制(dual attention mechanism)将局部特征与全局特征相结合,并用空洞卷积进行改进;再借鉴双向特征融合网络(BiFPN)的思想,加入新的浅层特征和深层特征信息传递路径,更好融合浅层中车辆的位置信息,并设计新的检测头,提高网络对小目标车辆的检测能力。研究结果表明,改进的RDB-YOLOv5相比YOLOv5的均值平均精度(mAP)增长2.7%,特别是小型车辆检测提高了3.5%,相较于传统模型RCNN等mAP整体平均提高了10%。RDB-YOLOv5能够在通用数据库上取得较高的检测精度,同时在遥感图像的复杂场景中能...  相似文献   

6.
在高分辨率遥感图像目标检测中,受云雾、光照、复杂背景、噪声等因素影响,现有目标检测方法虚警率高、速度慢、精确度低.为此提出基于深度神经网络剪枝的两阶段目标检测(object detection based on deep pruning,ODDP)方法.首先,给出深度神经网络剪枝方法,基于深度神经网络剪枝分别提出自主学习区域提取网络算法与优化训练分类网络算法;然后,将上述两算法用于卷积神经网络,得到两阶段目标检测模型.实验结果表明,在NWPU VHR-10高分辨率遥感数据集上,相比现有目标检测方法,ODDP的检测速度和精度均有一定提升.  相似文献   

7.
层级标签文本分类旨在从具有层级结构的标签集中选择与文本最匹配的标签。现有的文本分类方法,通常使用编码器提取文本特征进行预测,他们忽视了标签语义、标签之间的相关性、文本特征对标签特征的影响。针对以上问题,提出了融合标签结构的层级标签文本分类模型(Label Hierarchical and Semantic Structure Learning,LHSSL)。LHSSL充分利用了标签语义结构与层级结构信息,通过共享参数的图卷积神经网络学习两种结构的相似特征。然后将标签特征与文本特征动态连接,构造标签模拟分布作为soft target。与不考虑标签信息直接使用LSTM、Bert和添加标签平滑后的LSTM、Bert相比,该模型在四个数据集上的准确率都有了一定的提升。  相似文献   

8.
针对序列蒙特卡罗广义标签多伯努利滤波(SMC-GLMB)算法计算效率低、实时性差的问题,提出了箱粒子广义标签多伯努利滤波的目标跟踪(Box-GLMB)算法。该算法使用带标签的随机有限集描述多目标的状态,包括目标的位置和速度,并且对每个目标用互不相同的标签进行区分;然后利用箱粒子滤波算法近似单目标状态的概率密度,即用一组带权值的均匀分布拟合单目标状态概率密度;最后通过广义标签多伯努利滤波对多目标状态的概率密度进行预测与更新,从多目标状态后验概率密度中估计单目标的位置与速度,根据目标的标签可以实现航迹跟踪。BoxGLMB算法结合了箱粒子滤波与GLMB算法的优势,能够跟踪目标航迹,同时提高计算效率。仿真结果表明,Box-GLMB算法可以有效估计目标状态以及跟踪目标航迹,相比于SMC-GLMB算法,计算效率提升了62%。  相似文献   

9.
Slope One 协同过滤算法被广泛应用于个性化推荐系统中。标签是一种描述项目特性的重要形式,针对Slope One 算法推荐精度不足的问题,将标签信息融合到 Slope One 算法当中。同时参考 k 近邻算法思想,选取阈值过滤后的 k 近邻项目参与平均评分偏差计算,提高计算效率的同时增加预测精度。使用评分相似度和标签相似度作为权重修正线性回归模型。通过线性加权融合预测结果,进一步提升推荐质量。将算法应用于 MovieLens 数据集,与传统加权 Slope One 算法相比,平均绝对偏差下降4.8%,召回率和准确率分别提高32.1%和26.3%。  相似文献   

10.
针对MIMLSVM算法预测精度不高的问题,设计了一种新的基于改进MIMLSVM预测蛋白质功能模型.首先,采用改进的Hausdorff方法计算包之间的空间距离,并结合K-Medoids方法将MIML(多示例多标签)问题退化为多标签问题,以提高预测精度;然后,利用SVM算法将多标签问题转化为多个独立的二分类问题,结合蛋白质数据的特点,建立蛋白质功能预测模型,并利用粒子群算法优化模型参数;最后,通过对7种生物蛋白质功能预测的实验,证明所建模型的优越性.  相似文献   

11.
针对未知杂波和检测概率的跟踪环境下,标准的标签多伯努利(LMB)算法对机动目标跟踪性能较差等问题,提出鲁棒标签多伯努利机动目标跟踪算法(R-LMB).首先建立真实目标、杂波与检测概率的增广空间模型,然后结合多模型(MM)系统,推导出基于蒙特卡罗(SMC)实现的带有状态标签和LMB元素标签的预测与更新方程.研究结果表明:在杂波和检测概率先验未知的情况下,所提出的算法可实现对目标数和目标状态的准确估计,同时在低检测概率和高杂波强度环境中仍可保证良好的多机动目标跟踪性能.  相似文献   

12.
针对大幅面高分辨率光学遥感图像目标检测尚存在着检测精度和效率低的问题,提出了一种高分辨率遥感图像视感知目标检测算法。该算法首先通过显著区域有选择性的引导获取场景中的子区域,将计算资源转移到可能包含目标的区域中,以降低计算复杂度;然后,利用基于单次检测器(YOLO)卷积神经网络目标检测模型获取预选目标;最后,提出目标语义关联抑制对获取的预选目标进行筛选得到有效目标,能够减少虚假目标的干扰,降低虚警率。所提算法在公开NWPU_VHR-10数据集上的平均检测精度为0.865,高于对比算法,在包含更多高分辨率的LUT_VHRVOC-2数据集上,比YOLO的检测效果更好。实验结果表明,所提算法提高了大幅面高分辨率遥感图像的目标检测精度。  相似文献   

13.
支持向量回归机(SVR)和孪生支持向量回归机(TSVR)是机器学习中的常用算法.受TSVR启发,针对SVR训练速度和预测精度问题,提出一种新型非平行平面支持向量回归机(NNHSVR).NNHSVR的优势如下:(1)NNHSVR模型构造的是两个较小规模的二次规划问题,最终求解得到2个非平行平面,训练速度较SVR快;(2)NNHS-VR在目标函数中加入调节参数u,对边界函数进行约束,使得模型对离群点更加鲁棒.人工数据集和UCI数据集上的实验表明:NNHSVR算法不仅有较好的泛化性能,而且训练速度快.将NNHSVR算法应用于传染病预测问题,取得了比传统传染病预测模型BP神经网络更好的效果.  相似文献   

14.
目标检测是遥感图像处理领域的一项重要技术,遥感图像目标种类繁多且存在目标物体难以被检测.提出把YOLOv5算法应用到遥感图像目标检测的方法,首先选择YOLOv5x来构建网络模型,再通过Mosaic数据增强对样本集进行预处理和自适应锚框筛选方法确定锚框大小,然后切片卷积操作得到原始特征图,将原始特征图送入主干网络进行特征融合得到最优权重,最后采用GIOU Loss做边界框的损失函数和非极大值抑制目标框的筛选,对遥感图像进行目标检测.在公开的10类地理空间物体(NWPU-VHR 10)数据集进行了检测实验,以评估所提出模型的目标检测性能.对比实验表明,本文的模型mAP达到了0.9239,与使用相同数据集的模型中的最佳结果进行比较,mAP提升了1.78%,该方法可以提高遥感图像目标检测精度.  相似文献   

15.
针对目前遥感图像背景复杂信息量大,导致目标识别过程中特征检测准确率低,特征匹配识别时间长等问题,提出一种基于改进SURF(speeded-up robust features)算法的目标识别方法.该方法采用Grab Cut算法对目标模板进行分割,通过高斯混合模型(Gaussian mixture model,GMM)进行初始化以达到能量最小化分割,并通过快速Hessian矩阵进行特征检测,采用欧式距离完成匹配识别.实验结果表明:使用改进算法进行遥感图像目标识别,能有效去除冗余特征点,提高算法的识别精度和运算速度.  相似文献   

16.
行人重识别任务旨在跨相机下检索出特定的行人图像.虽然行人重识别任务得到了快速发展,在检索精度上得到很大的提升,但是依然面临着行人重识别模型在新的数据集上泛化能力有限,以及在无监督领域自适应任务中无法避免的伪标签噪声的问题.针对目前无监督领域自适应任务中由于聚类算法的局限性而导致伪标签出现噪声的问题,提出一种基于多度量融合的无监督领域自适应行人重识别算法.具体而言,多度量融合算法是在目标域上使用DBSCAN(density-based spatial clustering of applications with noise)聚类算法对特征空间的行人特征进行聚类时,通过多个特征相似度度量函数线性加权的方式,计算行人之间的特征相似度,从而在目标域上生成更为准确的伪标签,之后利用该伪标签微调模型.通过在Market1501→DukeMTMC-reID和DukeMTMC-reID→Market1501上大量的实验,证明多度量融合算法有效提升了行人重识别模型在无监督领域自适应任务上的检索精度.  相似文献   

17.
针对多标签文本分类任务中如何有效地提取文本特征和获取标签之间潜在的相关性问题,提出一种CNN(convolutional neural networks)结合Bi-LSTM (bi-directional long short-term memory)的模型.首先,通过CNN网络和最大池化提取文本的特征;然后,利用训练的Labeled-LDA(labeled latent dirichlet allocation)模型获取所有词与标签之间的词-标签概率信息;接着,使用Bi-LSTM网络和CNN网络提取当前预测文本中每个词的词-标签信息特征;最后,结合提取的文本特征,预测与当前文本相关联的标签集.实验结果表明,使用词-标签概率获取文本中词与标签之间的相关性信息,能够有效提升模型的F1值.  相似文献   

18.
由于图像成像机理差别较大,现有的算法无法提取可见光与红外异源图像上的共有特征用来匹配,进而无法实现异源图像目标识别. 针对此问题,本文提出了一种基于自标签技术的深度学习特征点提取匹配算法. 算法通过设计一个粗特征检测器并在合成影像上进行训练,使得该特征检测器在不同图像上都具特征提取能力. 利用本文提出的自标签方法将异源图像中共有的特征点进行提取,从而解决了现有算法无法获取异源图像共有特征的问题. 并利用自标签结果进行特征点检测器和描述子的训练,最终通过匹配的特征点实现了异源图像间的实例目标识别. 本文采集了不同场景下的可见光-红外无人机影像作为测试数据. 在异源测试数据集上,选择了6种不同的先进算法与本文算法进行了对比试验. 实验结果表明,该算法较现有的6种先进算法能够提取到更多、更精确的异源图像共有特征,与其他测试算法相比在异源图像测试数据上的平均精度有了明显提升.   相似文献   

19.
无人机技术的不断成熟,使得搭载高效视觉系统的无人机应用也更加广泛。针对无人机航拍图像中小目标较多、分辨率低等原因导致的检测精度不高的问题,提出了一种改进RetinaNet的无人机航拍目标检测算法。算法针对特征图中小目标信息提取不足的问题,设计了多阶段特征融合方法,并将其与注意力机制串联设计了特征挖掘模块,可以在浅层特征图中融入深层的语义信息,丰富小目标特征;设计了基于中心点检测的无锚框(Anchor-free)方法,网络通过对中心点的回归来定位目标,而不是通过固定大小的锚框去匹配,这样做可以使网络对小目标的回归更加灵活,提高了算法的整体性能;且通过深度可分离卷积方法对网络进行轻量化设计,以压缩模型大小并提高检测速度。实验结果表明,改进算法较原RetinaNet算法平均精度提升了8.5%,检测速度提升了6帧/s,且与其他先进算法相比也具有性能优势,达到了检测精度与检测速度的均衡。  相似文献   

20.
提出一种融合视觉特征及标签一致性的多标签图像标注方法VTC-KSVD.首先通过K均值奇异值分解(KSVD)法建立图像的标签一致性模型TC-KSVD,然后将多视图特征融合在该模型中.该方法既利用了训练样本的类标与编码系数的判别式模型,又利用了训练样本的标签与编码系数的关系,增加了字典的判别性,提高了标注性能.在Corel5K数据集上的实验结果表明,融合了多视图视觉特征与标签一致性的VTC-KSVD方法可以较为准确地找到视觉特征与语义特征均相似的图像近邻,能明显提升多标签图像的标注性能,并能有效缓解训练数据有限而引起的稀疏性问题.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号