首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 239 毫秒
1.
为了降低医生利用SPECT影像对甲状腺疾病进行临床诊断时的误诊率,提高深度学习算法在核医学影像辅助诊断中识别交叉影像特征的准确率,提出了基于ResNet模型的甲状腺SPECT影像诊断方法。利用深度卷积生成对抗网络(DCGAN)和高分辨率生成对抗网络(SRGAN)生成影像并提高分辨率,弥补训练数据的不足。同时,将残差块输出信息加上具有交叉特征影像信息的x_i,在保留已学习影像特征的基础上增加对交叉特征的学习,改进了模型。对于交叉影像特征,使用交叉训练集对经过单一特征影像训练完成的改进ResNet神经网络模型进行再训练。实验结果表明,经过100轮迭代,交叉训练集训练的改进ResNet神经网络模型验证精度高达0.963 3,验证损失降到0.118 7,并趋于稳定;识别结果,召回率、精确率、特异度和F_1分数都在93.8%以上。经过改进的神经网络模型和新的训练方法对甲状腺SPECT影像表现出的典型症状识别率较高,优于其他基于卷积神经网络(CNN)的方法,对临床影像诊断具有参考价值。  相似文献   

2.
基于深度学习的车标识别算法的研究与实现   总被引:1,自引:0,他引:1  
依据深度学习算法可以自主进行特征学习和识别的特点,提出一种基于Keras深度学习框架的车标识别算法。将该方法将ResNet50和Inception V3两模型相结合构建训练网络,以此建立分类器对车标图像进行识别。实验结果表明,该方法与传统的卷积神经网络分类进行比对,提高了车标识别的准确率。  相似文献   

3.
传统人脸识别方法手工设计特征过程复杂、识别率较低,对于开集人脸识别通用深度学习分类模型特征判别能力较弱。针对这两方面的不足,提出了一种以分类损失与中心损失相结合作为模型训练监督信号的深度卷积神经网络。首先,利用构建的应用场景数据集优调从公共数据集获得初始化参数的深度人脸识别模型,解决训练数据过小和数据分布差异问题,同时提高模型训练速度;然后,以传统损失函数和新的中心损失作为迁移学习过程中的监督信号,使得类内聚合、类间分散,提高模型输出人脸特征的判别能力;最后,对人脸特征进行主成分分析,进一步去除冗余特征,降低特征复杂度,提高人脸识别准确率。实验结果表明,与传统人脸识别算法相比该算法可以自动进行特征提取,并且相对于通用深度学习分类模型该算法通过度量学习使特征表示更具判别力。在自建测试集和LFW、YouTube Faces标准测试集上都取得了较高的识别率。  相似文献   

4.
针对Attention过于灵活的对齐方式在复杂环境中适应性差、简单端到端模型对语言特征利用不充分的问题,研究了基于多任务损失附加语言模型的语音识别方法.通过分析语音信号特征,训练中选用包含更多信息的特征.以基于Attention的Conformer端到端模型为基础,采用CTC损失辅助纯Conformer (Attention)的多任务损失训练模型,得到Conformer-CTC语音识别模型.在Conformer-CTC模型基础上,通过分析对比部分语言模型的特点与效果,将Transformer语言模型通过重打分机制附加至上述模型的训练中,最终得到Conformer-CTC-Transformer语音识别模型.在AISHELL-1数据集上对上述模型进行了试验.结果表明:Conformer-CTC模型相对于纯Conformer (Attention)模型在测试集上的字错率(character error rate,CER)降低了0.49%,而Conformer-CTC-Transformer模型相对于Conformer-CTC模型在测试集上的CER又降低了0.79%.CTC损失可以改善Att...  相似文献   

5.
针对声纹识别任务中常常出现的由于真实场景语音与模型训练语料在内部特征(情感、语言、说话风格、年龄)或外部特征(背景噪声、传输信号、麦克风、室内混响)等方面的差异所导致的模型识别率低的问题,提出了一种基于对抗网络的声纹识别域迁移算法。首先,利用源域语音对X-Vector的声纹识别模型进行训练;然后,采用域迁移方法将源域训练的XVector模型迁移至目标域训练数据;最后,在目标域测试数据上检测迁移后的模型性能,并将其与迁移前的模型性能进行对比。实验中采用AISHELL1作为源域,采用VoxCeleb1和CNCeleb分别作为目标域对算法性能进行测试。实验结果表明,采用本文方法进行迁移后,在VoxCeleb1和CN-Celeb的目标域测试集上的等错误率分别下降了21.46%和19.24%。  相似文献   

6.
将深度学习应用于行人重识别领域,嵌入多尺度注意力融合模块至神经网络中进行多尺度特征提取和表示,可有效提升注意力机制对深度学习网络的识别性能。提出了一种基于SE block的多尺度通道注意力融合模块,并结合ResNet50卷积神经网络提取特征;然后通过双向LSTM网络进一步提取特征序列上下文信息,在提高模型对图像重要特征的提取能力的同时,降低对图像冗余特征的关注度;最后使用级联难采样三元组损失函数和交叉熵损失函数共同训练网络模型,使样本能够在高维特征空间中实现聚类,进一步提升模型识别准确性。所提出算法在Market1501数据集和CUHK03数据集分别进行实验,并在同等条件下和其他注意力模块算法进行比较。为进一步验证各模块作用,对算法进行消融实验,以验证各模块的有效性,实验结果表明,所提出方法可有效应用于行人重识别  相似文献   

7.
在油气勘探中,利用深度学习技术对岩石进行识别与分类能极大提高工作效率。岩石采样并制作样本图像费时费力,因此岩石样本通常较少。有鉴于此,基于深度学习技术设计一个新的神经网络模型MyNet,该模型能对小样本进行学习并完成岩石样本的分类。使用数据增强技术通过Python编程将314张岩石样本扩充成28 272张图像,为了充分利用现有数据,取其中的27 384张作为训练集,剩余888张作为测试集。将数据分别导入MyNet、ResNet50、Vgg16进行训练和测试。实验结果表明,加载、不加载预训练参数的ResNet50、Vgg16的岩石分类结果因受有无迁移学习影响会有所不同;MyNet的总体分类准确率为75.6%,均优于有无迁移学习的ResNet50、Vgg16,且MyNet、ResNet50、Vgg16所需训练的参数量分别为919 278、25 503 912、138 357 544,显然,MyNet模型的复杂度与训练代价明显低于其他对比模型,但性能最优,说明新模型应用于小样本的岩石分类可行有效且经济安全,更容易推广应用。  相似文献   

8.
当前电气铭牌识别效果差,无法进行工程应用.为解决电气铭牌信息识别,提出1种基于工程方法和深度学习相结合的铭牌文本信息识别ResNet50_k模型.将电气铭牌识别分为2部分:不可变区域识别和可变信息区域.针对电气铭牌可变区域的文本提取和信息识别.首先,使用变动区域位置信息对变动区域经进行获取;其次,使用K-menas聚类算法和投影法对铭牌可变区域进行分割;最后,利用Keras深度学习框架搭建残差网络模型.模型经过对3 823类符的识别训练,验证准确率高达97.6%.与Tesseract OCR识别方法相比,ResNet50_k效果更好.在对自然场景下拍摄电气铭牌识别中,模型表现良好,能够适应复杂的电力场环境.  相似文献   

9.
为解决图像分类中深度卷积神经网络(Convolutional neural networks,CNN)中较为复杂的人工网络设计与调参问题,提出基于ResNet模块的进化卷积、神经网络(Evolutionary convolutional neural network,ECNN)的自动设计方法,并将其运用到图像分类中.该方法基于ResNet模块与2D卷积层,采用进化算法(Evolutionary algorithm,EA)对网络结构及参数进行优化.在NLM官方发布的疟疾数据集下进行实验,不同比例的测试集划分可以达到95.6%的分类准确率,文中算法与AlexNet、VGG16、Xception等人工设计的深度学习分类算法进行了比较,实验结果表明,其准确率提升了约1%.在斯坦福大学发布的Stanford cars车辆图像数据集中进行了算法泛化验证,结果表明,文中算法在不同比例数据的测试中准确率均在94.5%以上,将该算法与深度学习分类算法VGG16进行比较,准确率效果相当,模型测试图像分类耗时仅为VGG16耗时的1/13,且训练参数量较少.两组对比测试实验数据表明,相比人工设计的深度学习算法,本文方法具有较好的图像分类性能与较快的图像分类速度.  相似文献   

10.
为了提高深度度量学习模型训练中的图像检索性能,在度量学习模型SoftTriple的基础上,对损失函数和网络结构进行改进.网络结构改进是在SoftTriple网络结构的基础上引入BNNeck模块;在损失函数设计中,首先添加难例挖掘函数对损失函数进行改进,然后通过使用高阶矩来表征整体特征分布的思路提出了新的损失函数.实验表...  相似文献   

11.
针对开集声纹识别的自适应阈值计算问题,提出一种基于大津算法和深度学习的阈值计算方法.首先,采用三层受限Boltzmann机堆叠而成的深度置信网络从Mel倒谱系数中提取语音深层特征;其次,通过Gauss混合模型计算特征的相似度值,对特征的相似度值使用大津算法计算阈值.实验结果表明,该方法识别效果较理想,与等错误率计算阈值...  相似文献   

12.
识别砂岩中的石英、长石和岩屑对判断沉积环境具有重要意义,但传统的人工识别方法存在主观性强、对经验依赖程度高等问题。本文利用深度学习、卷积神经网络等技术构建了一种基于Faster R-CNN目标检测算法的砂岩显微组分图像识别方法,实现了正交偏光下对薄片图像中石英、长石、岩屑三种组分的智能识别,三种组分平均识别准确率为89.28%。为了验证模型的可靠性,实验对比了不同算法和特征提取网络,结果表明:Faster R-CNN目标检测算法的识别效果优于YOLO V3、YOLO V4、YOLO V5s,ResNet50特征提取网络的表现效果优于VGG16。采用ResNet50特征提取网络的Faster R-CNN目标检测模型优势显著,它可以更好满足岩石薄片的识别要求,为传统的人工方法提供智能化技术方案。  相似文献   

13.
马永忠  夏保丽 《广西科学》2023,30(1):139-148
针对现有僵尸网络检测方法检测精度不高和检测时间开销较大的问题,提出一种基于改进Transformer和强化学习的僵尸网络域名生成算法(Domain Generation Algorithm,DGA)的域名检测方法。首先,利用深度可分离卷积替换ResNet和ResNeXt网络中的卷积块,通过减少网络模型参数来降低模型的时间开销;其次,利用改进后的ResNet和ResNeXt网络将域名字符串映射到深度特征空间,构造多尺度特征,强化特征的表达能力;再次,利用长短期记忆神经网络(Long Short-Term Memory,LSTM)对Transformer网络进行改进,在保持字符间相对位置的同时,进一步建立上下文的长距离依赖编码,并在此基础上引入注意力机制,强化模型对关键特征的捕获能力;最后,引入强化学习对模型进行微调,提高DGA域名的检测精度。在多个DGA域名数据集上进行测试验证,结果表明该模型在保持检测时间开销较小的基础上,具有更高的检测精度。  相似文献   

14.
针对在耀光、紊流、降雨等复杂含噪场景下时空图像中有效纹理特征变得模糊,使得现有纹理主方向检测算法精度受限的问题,结合深度学习的思想,提出了一种基于残差网络回归模型的时空图像测速(ResNet50-STIV)法,并借助残差网络回归模型强大的非线性学习能力构建了回归预测函数。通过构建人工合成数据集和包含复杂场景时空图像的天然河流数据集对残差网络回归模型进行试验,结果表明:提出的残差网络回归模型在人工合成数据集下的检测精测可达到0.1°,对于天然河流数据集,具有残差结构的ResNet回归模型的检测精度优于VGG16;从模型层数看,基于ResNet50的回归模型能较好地平衡检测精度以及执行效率,在正常场景下的检测精度达到0.7°,而在耀光、紊流、降雨场景下能控制在1.3°以内,ResNet50-STIV优于现有的时空图像测速法;与流速仪法在多场景下表面流速比测的最大相对误差小于12%。  相似文献   

15.
为了提高赤足足迹人身识别算法的准确率,本文提出了一种基于深度学习的足迹识别算法。由于足底各区域压力的不同导致了赤足足迹各部分包含的信息量存在一定的差异性,为了获取更稳定、区分度更高的特征,采用ResNet50作为基础网络,在特征层进行分块处理。本文基于2000人的赤足足迹库进行训练,利用500人1000幅测试图在3000人的赤足测试库上进行测试。所提出算法的首位识别准确率达到了98.50%,优于常规的ResNet50网络。实验证明,本文提出的基于特征分块的足迹识别算法在赤足足迹识别中获得了很好的识别效果。  相似文献   

16.
陈健昌  张志华 《科学技术与工程》2021,21(24):10491-10497
路面裂缝形状不规则复杂程度高。传统路面裂缝识别技术需要对路面图像进行复杂预处理工作进行识别,不能自动化对路面裂缝图像进行分类。为提高对路面裂缝识别精度和效率,本文将基于深度学习方法提出一种自动识别路面裂缝并能减少图像预处理工作量的方法。首先,将原始图像切割为小样本图像,根据图像多特征进行分类,各选取相同类型样本2000张图像构建数据集;其次,利用双线性内插法对裁剪后图像进行上采样,凸显图像特征便于神经网络学习;最后,使用深度学习神经网络对训练样本进行特征提取训练模型。实验结果表明:ResNet101模型评估指标均优于其他深度学习模型和机器学习模型,模型测试精度达0.898,kappa系数为0.815。  相似文献   

17.
空中交通管制员疲劳工作势必会严重威胁空中交通安全,通过对眼睛睁闭状态判定是现阶段对管制员疲劳检测的一种主要方式。为检测管制员疲劳状态,提出了一种基于迁移学习的DCNN眼睛状态识别模型。首先,利用深度级联神经网络的MTCNN算法检测出管制员面部区域,并实现对面部5个关键点标定和眼睛的定位;然后将检测到的眼睛图像传入到预训练的DCNN眼睛状态分类模型,识别眼睛的睁闭眼状态;最后结合PERCLOSE 80指标检测管制员疲劳状态。分别在ZJU、CEW和ATCE数据集上,对DCNN、VGG16、InceptionV3、ResNet50四种模型的准确率、损失率和F1分数指标进行对比实验。实验结果表明:在ZJU和CEW数据集上,DCNN眼睛状态分类模型检测准确率为97%,较VGG16、InceptionV3、ResNet50等模型进行眼部状态分类任务,DCNN模型的F1分数有3%至7%的提高。在ATCE数据集上DCNN模型检测准确率达到98.35%,F1分数达到98.06%,验证了DCNN模型的有效性与准确性。  相似文献   

18.
汪志成  赵杰  沈博韬  王哲 《科学技术与工程》2023,23(33):14278-14286
针对婴儿全身运动质量评估问题,本文基于姿势识别对婴儿运动特征进行提取与分析,提出基于ResNet和反卷积层的婴儿姿势热力图识别模型,平均识别率达到86.9%;利用婴儿的二维姿势坐标,建立基于DenseNet的3D人体姿势识别模型,使用1D卷积网络及1D连接层,实现婴儿的2D姿势坐标到3D姿势坐标的升维推算;使用四元数作为空间向量表示方式,对婴儿主要肢体运动的角度、角速度、角加速度进行提取,并提出基于SVM的由婴儿肢体运动角度特征进行判定的婴儿异常行为识别模型。针对模型参数过多的问题,在保证模型整体识别率的情况下,使用主成分分析的方式对模型进行特征降维,提高整体识别速度,将维度由18维度降低至8维度后,整体运行时间减少近50%,且对于不同的视频样品均能正确分类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号