首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
针对传统卷积神经网络对远距离视频目标识别效果差的原因,本文提出一种改进的基于SSD卷积网络的视频目标检测模型.首先,对数据集进行剪裁,旋转等预处理,提高网络检测泛化能力,其次,采用coco数据集Mobilenet_SSD预训练模型,由于其具有轻量级网络模型特点,减少计算开销,减少内存占用量.然后,再结合voc2012数据集进行二次训练微调处理,加快训练收敛速度,使用自定义数据集能有效检测特定场景目标,能够有效识别远距离场景下视频目标物体.实验结果表明,改进的网络检测模型适用于远距离目标检测,减少计算量,降低硬件内存资源消耗,提高网络模型性能和检测精确度,具有较好的鲁棒性.  相似文献   

2.
利用远红外光谱视频进行老人摔倒检测研究,提出一种基于人体骨架模型的远红外视频下老人摔倒检测算法;采用YOLOv4-Tiny算法获取远红外视频中人体目标位置,再利用COCO数据集训练的区域多人姿态估计网络模型,直接对自采集的远红外视频进行人体骨架提取,得到人体关节点序列,然后对人体骨架建立时空图卷积模型进行特征提取进而检...  相似文献   

3.
传统地形识别算法,主要建立在人工提取特征和训练分类器的前提上,其通用能力有限且准确度不高,或者需要大量的数据集训练基础,这种方法训练的网络模型参数较大且预测耗时较长,不利于移植到移动端。因此,运用迁移学习思想,提出了一种基于深度迁移网络的地形识别算法。采用轻量级卷积神经网络MobileNetV3,在爬虫获取和自建适量数据集基础上,对神经网络进行迁移学习。首先,采用图像分类数据集ImageNet上的预训练成果,根据预训练模型权重对MobileNetV3网络进行初始化,实现对模型大规模共享参数的迁移;然后,通过在自建数据集GXU-Terrain6上进行新的训练,微调模型参数,进而得到新的分类模型;最后,利用训练好的模型对地形类别进行预测,从而完成识别任务。提出算法在GXU-Terrain6测试集上取得了93.00%的平均预测准确率。实验结果表明,基于深度迁移的地形识别算法运用较少数据,可获得较高的识别准确率,网络实时性好,适合向移动端移植。  相似文献   

4.
作为深度学习的一种有效算法,深度卷积网络已成功应用在处理图像、视频和音频等领域.通过建立一卷积神经网络模型并应用于网络入侵检测,选取的卷积核与数据进行卷积操作提取特征的局部相关性从而提高特征提取的准确度.采集到的网络数据通过多层"卷积层-下采样层"的处理对网络中正常行为和异常行为的特征进行深度刻画,最后通过多层感知机进行正确分类.KDD 99数据集上的实验表明,文中提出的卷积神经网络模型与经典BP神经网络、SVM算法等相比,有效提高了入侵检测识别的分类准确性.   相似文献   

5.
深度学习中卷积神经网络在行为识别领域有着良好的识别效果,但是由于深度学习需要较大数据集训练模型,而现今公开数据集中危险行为识别相关方向没有大量数据集。针对危险行为识别领域样本少、无法进行深度学习训练等问题,建立了危险行为识别数据集,并采用迁移学习方法对C3D网络模型进行迁移训练。结果表明,迁移学习后C3D网络模型对危险行为识别数据集平均识别率达到了83. 2%,可以有效识别危险行为动作。  相似文献   

6.
针对现有铁路人员入侵识别准确率不高、实时性较差的问题,在YOLOv4模型的基础上提出一种R-YOLO轨道人员目标检测模型。首先,用轻量级骨干网络ResNet50代替原有的CSPDarknet53网络,利用深度可分离卷积替代PANet中的标准卷积,减少网络层数以及模型体积,加快模型的识别速度。其次,在加强特征提取网络的3个特征层分别加入有效通道注意力模块,采用K-means++聚类算法重新对数据集进行聚类和分析,提高目标检测模型的精度;在模型训练方面,采用迁移学习和混合数据集联合训练,解决人员识别精度不理想以及误检漏检等问题。最后,利用R-YOLO轨道人员目标检测模型对真实铁路人员入侵数据集进行测试。结果表明,R-YOLO模型在真实铁路人员入侵数据集上的平均识别精度达到了92.12%,较传统YOLOv4算法高出1.89%,帧速率由38.74 f·s-1提升到47.73 f·s-1。R-YOLO模型部分解决了铁路入侵人员误检漏检问题,提高了铁路人员入侵识别的实时性和准确率,为铁路安全运行提供了保障。  相似文献   

7.
针对原有双流时空卷积网络模型中网络深度不足,从而导致人体行为识别结果偏低的问题,针对该网络模型进行改进,且融入Kinect骨骼序列数据.对于输入数据,通过Kinect相机对人体动作转化为骨骼序列;改进双流卷积网络模型是在原有的模型框架下,用RestNet-50网络结构替代原VGG-16网络结构,再对数据进行一系列处理.在HMDB-51和UCF-101两个公开数据集上进行模型的训练和验证,其识别结果分别为70.8%和91.4%,通过对比结果表明,本文提出的改进双流卷积网络融合Kinect骨骼数据能够有效提升人体行为识别的正确率.  相似文献   

8.
针对合成孔径雷达(SAR)海面溢油检测问题,采用Yolov4目标检测模型、语义分割网络(U-Net)模型、Xception预训练模型等多种卷积神经网络模型进行SAR图像海面溢油检测的模拟实验。基于一个仅有790个样本的像素为256×256的SAR图像海面溢油数据集,深入对比研究了3种SAR图像海面溢油检测神经网络模型,分析了不同检测模型在海面溢油检测中的检测效果。实验结果表明,相较于其他两种检测模型,Xception预训练模型具有更高的SAR图像海面溢油检测精度,更加适合应用于小数据集的溢油检测。  相似文献   

9.
为了对灾难场景图像进行快速分析和识别,提出了一种基于多分辨率卷积神经网络和残差注意力机制(attention module)相结合的图像分类模型.首先,对灾难场景数据集进行预处理,在相同类型的条件下将其随机划分为训练集和测试集.基于改进的卷积神经网络(convolutional neural network,CNN),提取训练集的图像特征.使用训练集图片的特征进行训练,并且在测试集图片上实现分类测试.选取DenseNet、Xception和MobileNetV2三种模型,以灾难场景数据集(Disaster_Data_Scenes)为数据集进行实验验证.结果表明:改进的Xception和MobileNetV2网络在灾难场景数据集上进行的图像分类实验测试,比原网络精度分别提升了4.56%和3.04%.其中改进的DenseNet网络比原网络模型精度分别提升9.13%、17.88%和10.27%.可见改进的卷积神经网络模型的分类精度得到有效提高.  相似文献   

10.
为实现玉米病害图像快速、准确识别,提出了一种基于非对称注意力机制残差网络(asymmetric convolution attention resnet,ACA-Resnet)的图像检测模型.在残差网络的基础上,通过引入非对称卷积结构减少参数量,加快模型训练速度,同时引入注意力机制,改善模型的表达能力,提高检测准确率.为减小由于病害图片数量不足而造成的过拟合现象,采用迁移学习的方法提高模型的稳定性和泛化能力.结果 表明,ACA-Resnet经过ImageNet数据集预训练后对玉米病害图像的平均识别准确率可达到97.25%,较VGG-16、Inception-V3和ResNet50等网络分类效果更好,相较于Resnet50训练速度明显提升.可见本文方法训练速度快,识别精度高,可为玉米病害检测提供借鉴.  相似文献   

11.
在公共安全检查领域中,研究毫米波图像目标检测的快速性和精准性的方法具有非常重要的实际应用价值。提出了基于Faster R-CNN深度学习的方法检测隐藏在人体上的危险物品。该方法将区域建议网络(region proposal network,RPN)和VGG16训练卷积神经网络模型相结合,接着通过在线难例挖掘(online hard example mining,OHEM)技术优化训练所提出的网络模型,从而构建了面向毫米波图像目标检测的深度卷积神经网络。实验结果证明所提的方法能高效地检测毫米波图像中的危险物品,并且目标检测的平均精度高达约94.66%,检测速度约为6帧/s,同时对毫米波安检系统的智能化发展有着极其重要的参考价值。  相似文献   

12.
地下排水管道缺陷检测是地下管线高效管理的基础,也是实现“智慧城市”的关键性问题。针对工程项目中对管道缺陷判别的需要,提出并实现了一套实用的地下排水管道缺陷智能检测FEDDR(frame extracting-detection-duplicate removal)系统,将视频缺陷检测过程分为检测前的视频预处理阶段、缺陷检测模型构建阶段以及缺陷检测优化3个阶段,采用帧间差分算法及VGG16网络对管道视频抽帧处理,筛选出兴趣检测帧,减少待检测数据量;选取YOLOv3为网络主框架,用轻量高效的EfficientNet结构替换原来的主干网络,采用迁移学习策略,用自建数据集Pipe-DATA对其进行训练,建立起高效的管道缺陷检测模型,并在检测帧输出检测结果时采用两次输出的优化策略来防止缺陷漏检;对检测出的缺陷帧图像进行文字识别,去重优化自动生成结果表单。将该方法应用到了某区域的将近3 km的管道视频数据中,共检测出了656个缺陷,与人工判别结果对比,准确率达94.3%,召回率达到98.7%,整个过程一体化完成,大大减少了人工成本,提高了排水管道缺陷的检测效率,具有工程实用性。  相似文献   

13.
The devastating effects of wildland fire are an unsolved problem, resulting in human losses and the destruction of natural and economic resources. Convolutional neural network(CNN) is shown to perform very well in the area of object classification. This network has the ability to perform feature extraction and classification within the same architecture. In this paper, we propose a CNN for identifying fire in videos. A deep domain based method for video fire detection is proposed to extract a powerful feature representation of fire. Testing on real video sequences, the proposed approach achieves better classification performance as some of relevant conventional video based fire detection methods and indicates that using CNN to detect fire in videos is efficient. To balance the efficiency and accuracy, the model is fine-tuned considering the nature of the target problem and fire data. Experimental results on benchmark fire datasets reveal the effectiveness of the proposed framework and validate its suitability for fire detection in closed-circuit television surveillance systems compared to state-of-the-art methods.  相似文献   

14.
刘今子  董浩  方文璇  黄东 《科学技术与工程》2022,22(32):14328-14338
近年来,直肠癌的患病率普遍提高,准确判断直肠癌周围淋巴结的转移情况,往往能显著提高患者的治愈机率。本文通过建立数学模型,运用卷积神经网络模型进行智能判断直肠癌淋巴结转移情况。以直肠肿瘤患者动脉期的CT图像和肿瘤掩模图为样本,建立基于U-Net的CT图像识别分割模型,通过下、上采样分割出直肠肿瘤所在的区域,对肿瘤区域已转移淋巴结的普遍特征进行深度挖掘,利用SIFT算法自动找出肿瘤区域特征点,以及传统的特征纹理、面积、周长和体素强度,分别送入传统卷积神经网络模型和改进后的卷积神经网络模型VGG16网络模型,进行训练、预测、对比。结果表明,传统卷积神经网络模型的准确率在75.32%,而改进后的VGG16网络模型准确率在90.04%,可见,VGG16网络模型对直肠癌淋巴结转移情况的预测效果更好。  相似文献   

15.
为了解决电力施工现场中安全帽佩戴情况以及危险区域行人入侵检测问题,提出一种基于改进Mask R-CNN模型的目标检测方法。首先依据迁移学习策略对Mask R-CNN主干网络进行参数初始化,以提取图像基本特征;然后引入特征金字塔结构进行自下而上的特征图提取,完成多尺度特征融合;接着,通过多尺度变换方法对区域推荐网络进行调整,获取锚点进行回归计算完成检测实验;最终对结果进行分析评价,多目标平均准确率达到了95.22%。将改进后的Mask R-CNN模型用于监控视频分析,针对监控视频像素过低问题,加入拉普拉斯算法锐化边缘,精准率提高到90.9%,验证了拉普拉斯算法对低质量监控视频检测的有效性。  相似文献   

16.
暴力事件检测是视频内容智能分析的一个常见任务,在互联网视频内容审查、影视作品分析、安防视频监控等领域有重要应用.面向视频中暴力检测任务,提出了一个包含关系网络和注意力机制的方法来融合视频中的多模态特征,该方法首先使用深度学习提取视频中多个模态特征,如音频特征、光流特征、视频帧特征,接着组合不同的模态特征,利用关系网络来建模多模态之间的关系;然后基于深度神经网络设计了多头注意力模块,学习多个不同的注意力权重来聚焦视频的不同方面,以生成区分力强的视频特征.该方法可以融合视频中多个模态,提高了暴力检测准确率.在公开数据集上训练和验证的实验结果表明,提出的多模态特征融合方法,与仅使用单模态数据的方法和现有多模态融合的方法相比,具有明显的优势,检测准确率分别提升了4.89%和1.66%.  相似文献   

17.
针对公路交通监控的需求增大与网络带宽资源有限的矛盾,本文提出一种贝叶斯压缩感知的目标检测算法.该算法采用小波基对信号进行稀疏,用部分哈达玛测量矩阵进行观测,实现视频的压缩,为了得到更为准确的前景,提出在部分时间均衡自适应背景模型下,将背景分割思想和小波树结构的贝叶斯压缩感知结合的重构算法完成目标检测.通过对多个场景监控视频的试验,验证了该方法的准确性和有效性,并对光线变化具有一定的鲁棒性和减少视频传输的成本.  相似文献   

18.
深度学习技术能以端对端方式实现农作物害虫识别,克服了传统机器学习方法特征选择具有主观性以及提取特征操作繁琐等不足,但识别的准确率和鲁棒性仍有待提高。为了研究出一种快速,高效的水稻害虫识别方法,本研究以稻纵卷叶螟、三化螟、稻蝗、稻飞虱4种常见的水稻害虫为研究对象,对传统的卷积神经网络Alexnet进行优化改进。首先从自然环境以及搜索引擎上获取4种不同的水稻害虫图像,并对图像进行数量扩增和细节增强预处理。然后对传统的卷积神经网络Alexnet进行优化改进,在Alexnet模型基础上,去除原有局部响应归一化层,在每一个卷积层后加入批归一化层,并采用全局平均池化和激活函数PReLU对模型结构进行优化。结果表明:改进后的模型在害虫数据集上的识别率不低于98%,相比于原网络提升了1.96%,高于LeNet5、VGG13、VGG16等传统网络;改进后的模型的损失值稳定在0.03附近,相比于原网络降低了0.1,均低于LeNet5、VGG13、VGG16等传统网络。从实验结果来看,改进后的方法在水稻害虫分类上有较高的识别率和较好的鲁棒性,可以为农作物害虫的智能识别提供了新的思路和方法。  相似文献   

19.
为提高管道缺陷图像检测的准确率,提出一种基于改进RefineDet的管道数字射线成像(digital radiography,DR)缺陷图像检测模型。该模型针对管道DR缺陷图像数据少、目标少等特点,从以下三个方面进行改进。首先,在骨干网络设计方面,使用Swin transformer代替VGG16作为主干网络,在提高特征提取能力的同时减少主干网络参数量。其次,针对管道DR缺陷图像目标数量较少而易受背景干扰问题,通过在主干网络与特征融合阶段之间加入全局注意力模块来强化模型对重要特征的关注,从而提高检测性能。最后,在后处理阶段,针对传统的非最大值抑制算法直接去除非最好预测框问题,使用软非最大值抑制算法以更合理的方式去除非最优预测框。结果表明:该方法能够有效实现管道DR缺陷图像的检测,并且相比于其他4种常用的目标检测模型,提出的模型可以有效提升管道DR缺陷图像检测的准确率,研究成果可为DR缺陷图像检测提供技术支撑。  相似文献   

20.
同时保证网络剪枝方法的准确率和稳定性,提出一种基于通道域自注意力的特征图剪枝方法。该方法采用主成分分析(principle component analysis, PCA)算法降低噪声干扰,引入通道域注意力为特征图自动分配不同权重,移除低权重通道的滤波器,并对网络进行重训练和精调,以减少网络精度损失。在公开数据集上对VGG 16网络模型展开的实验表明,当剪枝率为60%时,达到视觉几何组模型Top 5的准确率为8923%;当剪枝率逐渐增加到80%时,仍保持73%准确率。相较于同类方法,本文提出的方法更能保证剪枝时模型的准确率和稳定性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号