首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
多边形网格作为一种复杂的数据结构为三维物体提供了有效的形状近似表示,但由于网格数据的复杂性和不规则性,卷积神经网络很难直接应用到三维网格数据处理中.因此,提出一种基于胶囊网络的深度学习方法对三维网格数据进行有效分类.首先设计一种能够直接在网格表面进行计算的多项式卷积模板,提取三维网格模型的高阶参数特征.同时,为解决传统卷积神经网络大量池化层的引入导致的特征丢失问题,针对输入网格模型尺寸大小不统一问题,改进了胶囊网络姿态参数学习方法,通过共享姿态矩阵权值,减少模型参数量,进一步提高了三维网格模型的训练效率.实验在SHREC15数据集上与传统方法和最新的两种方法进行比较,相比于最新方法 MeshNet和MeshCNN,在原始测试集上的平均识别准确率提高了3.4和2.1个百分点,且融合特征后平均准确率达到93.8%.经实验验证,在训练时间较短的前提下,该方法也能取得相当的识别效果.本文所提出的三维网格分类方法,综合了图形学与深度学习方法的优点,有效提高了三维网格模型的分类效果.  相似文献   

2.
针对现有点云识别与分割算法因忽视点的位置特征和局部几何特征关系而导致难以捕获具有鉴别力的局部几何信息的问题,提出基于位置关系深度残差神经网络的三维点云识别与分割算法。将原始点云嵌入到高维空间并获取其高维特征;将点云的高维特征输入位置关系卷积实现局部邻域内当前点特征与位置几何特征的信息交流,并通过深度残差模块强化提取到的深层语义特征,分层重复以上步骤可逐步得到点云的高级上下文语义特征;通过全连接层与解码器,得到点云的识别与分割结果。实验结果表明,所提算法在ModelNet40点云分类数据集的识别精度达到了93.9%,在ShapeNet Part点云部件语义分割数据集的平均交并比达到了86.0%。所提算法能够提取三维点云的关键特征信息,具有较好的三维点云识别与分割能力。  相似文献   

3.
针对目前实验方法识别天然无序蛋白质中的功能模体耗时费力、难度大,而传统计算机辅助识别方法过于依赖人工挑选特征且准确度低等问题,提出一种利用深度卷积神经网络预测功能模体位置的方法;该方法直接将蛋白质序列作为输入,通过计算对应的位置特异性打分矩阵和3组氨基酸指数特征,将序列映射到数值矩阵中,模型自行抽取特征并自动识别功能模体的隐性序列模式来进行预测。结果表明:当使用相同数据集进行训练和测试时,本文中提出的方法的性能明显优于其他传统的识别算法,在验证集上的感受性曲线下的面积(AUC)值达到0.708,在测试集上的AUC值达到0.760,说明深度卷积神经网络能够有效地识别功能模体的隐性序列模式;该方法也可以用于其他聚集型蛋白质功能位点的识别。  相似文献   

4.
研究一种基于神经网络的端到端中文语音识别算法.算法将语音信息处理为频谱图,基于频谱图,设计和实现一种基于卷积神经网络和循环神经网络的深度学习模型结构用于中文语音识别.模型以汉字作为标签样本,运用训练算法和序列损失函数进行模型迭代训练最终模型;采用开源数据集,通过实验验证网络结构对识别效果的影响,同时对比传统的语音识别算...  相似文献   

5.
为解决图像采集中噪声和复杂背景对图片的影响以及深度神经网络的高耗时问题,基于可能性聚类算法与卷积神经网络,提出一种道路交通标识识别算法.该方法运用了图像分割技术,并结合卷积神经网络模型对道路交通标识进行更准确的识别.首先,通过色彩增强、图像分割、特征提取、数据增强和归一化等批量预处理操作,形成一个完整的数据集;然后,结合Squeeze-and-Excitation思想和残差网络结构,充分训练出MRESE(My Residual-Squeeze and Excitation)卷积神经网络模型;最后,将优化的网络模型用于道路交通标志的识别.实验结果表明,该方法使训练时间缩短了5%左右,识别精度可达99.02%.  相似文献   

6.
提出一种基于2D先验的3D目标判定算法.首先用轻量级MobileNet网络替换经典SSD的VGG-16网络,构建出MobileNet-SSD目标检测模型;其次,通过改进网络结构,提高模型对小目标的检测能力,并引入Focal Loss函数来解决正负样本不均衡和易分样本占比较高的问题;在相同数据集上,将改进算法与Faster R-CNN、 YOLOv3及MobileNet-SSD进行对比测试,其平均精度mAP分别提高了7.2%、 8.8%和10.6%;最后,通过改进算法获取ROI,利用深度相机将二维ROI转换为ROI点云,并借助直通滤波来判断目标物体是否为真实场景物体,既省去了传统点云识别中的诸多步骤又避免了点云深度学习中三维数据集制作难度较大的问题,在识别速度和识别精度上达到了较好的平衡.  相似文献   

7.
提出一种基于深度学习和光场成像的火焰三维温度场快速重建算法.该算法利用卷积神经网络对火焰光场图像进行深层特征提取,建立了光场图像与三维温度场之间的映射关系,从而实现火焰三维温度场的快速重建;利用视在光线法构建了火焰光场图像和三维温度场数据集,对卷积神经网络进行训练,利用测试集对训练结果进行了验证和评价,并将卷积神经网络算法与传统非负最小二乘(NNLS)算法的重建结果进行了对比.结果 表明,基于深度学习和光场成像的火焰三维温度场重建算法可准确重建火焰温度场,同时具有较高的计算效率(火焰的网格划分为10×8×15,NNLS算法的重建时间为4759 s,深度学习算法的重建时间为830 μs),平均相对误差为0.14%,且对于图像噪声具有良好的鲁棒性.  相似文献   

8.
提出了一种新的三维物体检测方法.在物体定位部分,采用随机采样一致和欧式聚类算法分割三维物体点云以减少计算量;在物体识别部分,将物体点云转化为深度图像,利用k-Means聚类算法学习卷积核,利用卷积网络提取卷积特征,从而提高图像的识别率,并在2个公开的三维物体数据集上对所提出的特征提取算法进行测试.结果表明,与传统的点云特征提取方法相比,基于卷积网络的特征提取方法的识别率较高.  相似文献   

9.
传统地形识别算法,主要建立在人工提取特征和训练分类器的前提上,其通用能力有限且准确度不高,或者需要大量的数据集训练基础,这种方法训练的网络模型参数较大且预测耗时较长,不利于移植到移动端。因此,运用迁移学习思想,提出了一种基于深度迁移网络的地形识别算法。采用轻量级卷积神经网络MobileNetV3,在爬虫获取和自建适量数据集基础上,对神经网络进行迁移学习。首先,采用图像分类数据集ImageNet上的预训练成果,根据预训练模型权重对MobileNetV3网络进行初始化,实现对模型大规模共享参数的迁移;然后,通过在自建数据集GXU-Terrain6上进行新的训练,微调模型参数,进而得到新的分类模型;最后,利用训练好的模型对地形类别进行预测,从而完成识别任务。提出算法在GXU-Terrain6测试集上取得了93.00%的平均预测准确率。实验结果表明,基于深度迁移的地形识别算法运用较少数据,可获得较高的识别准确率,网络实时性好,适合向移动端移植。  相似文献   

10.
为了对灾难场景图像进行快速分析和识别,提出了一种基于多分辨率卷积神经网络和残差注意力机制(attention module)相结合的图像分类模型.首先,对灾难场景数据集进行预处理,在相同类型的条件下将其随机划分为训练集和测试集.基于改进的卷积神经网络(convolutional neural network,CNN),提取训练集的图像特征.使用训练集图片的特征进行训练,并且在测试集图片上实现分类测试.选取DenseNet、Xception和MobileNetV2三种模型,以灾难场景数据集(Disaster_Data_Scenes)为数据集进行实验验证.结果表明:改进的Xception和MobileNetV2网络在灾难场景数据集上进行的图像分类实验测试,比原网络精度分别提升了4.56%和3.04%.其中改进的DenseNet网络比原网络模型精度分别提升9.13%、17.88%和10.27%.可见改进的卷积神经网络模型的分类精度得到有效提高.  相似文献   

11.
近年来卷积神经网络(convolutional neural network,CNN)在行为识别任务中取得了较大的进展.然而,现有的神经网络方法往往只注重高层语义信息的利用,对浅层特征信息挖掘利用不够.针对这一问题,提出一种基于3D卷积(convolution 3D,C3D)的多尺度3D卷积神经网络的行为识别方法.该方法受到特征金字塔结构的启发,在原C3D的基础上融合C3D的浅层特征信息,实现端到端的行为识别.同时该方法以现有的深度学习理论为基础,利用迁移学习的思想,将C3D和该方法中相同模块部分的参数迁移到本方法中,以降低模型的训练时间.通过在UCF101数据集上进行实验,实验结果表明,提出行为识别方法的分类精度达到84.56%,分类效果优于原C3D分类网络.  相似文献   

12.
李梦吉  韩燮 《科学技术与工程》2020,20(13):5235-5239
计算机辅助设计(CAD)模型是一种带有顶点信息和网格信息的三维数据,三维模型数据存储方式常见的有点云、体素、网格模型等是典型的非欧氏空间数据。为了改进现有方法利用深度学习训练CAD模型的分类时,常有丢失局部信息或局部信息提取不足的情况。针对这种非欧氏空间的CAD数据,提出了一个结合CAD数据本身特点的基于图卷积的分类模型。首先通过图卷积网络(GCN)计算顶点的邻接矩阵和顶点的度矩阵。针对CAD模型的特点提出了不同于K近邻(KNN)的方法,直接根据CAD模型面片信息构建计算所需的邻接矩阵。其次,图卷积网络可以聚合邻近顶点的信息,设计通过拼接两层图卷积网络来提取不同尺度的局部特征。结果表明:在ModelNet40 CAD模型数据集上,若采用CAD模型面片信息建图的方法,本文方法为91.2%。而采用KNN建图的方法虽然比PointNet++模型低1%的精确度,比KD-NET模型低0.9%的精确度,但参数量要比PointNet++减少0.54 MB,比KD-NET减少6.54 MB。可见本文模型结合了CAD模型的特点和图卷积聚合邻接顶点提取局部信息的优势,使得分类的精确度相比PointNet++提高0.6%,用更少的模型参数量得到了更高的分类精确度。  相似文献   

13.
传统人脸识别方法手工设计特征过程复杂、识别率较低,对于开集人脸识别通用深度学习分类模型特征判别能力较弱。针对这两方面的不足,提出了一种以分类损失与中心损失相结合作为模型训练监督信号的深度卷积神经网络。首先,利用构建的应用场景数据集优调从公共数据集获得初始化参数的深度人脸识别模型,解决训练数据过小和数据分布差异问题,同时提高模型训练速度;然后,以传统损失函数和新的中心损失作为迁移学习过程中的监督信号,使得类内聚合、类间分散,提高模型输出人脸特征的判别能力;最后,对人脸特征进行主成分分析,进一步去除冗余特征,降低特征复杂度,提高人脸识别准确率。实验结果表明,与传统人脸识别算法相比该算法可以自动进行特征提取,并且相对于通用深度学习分类模型该算法通过度量学习使特征表示更具判别力。在自建测试集和LFW、YouTube Faces标准测试集上都取得了较高的识别率。  相似文献   

14.
提出一种基于深度卷积神经网络的化妆品塑料瓶表面缺陷检测算法。采用百万像素级别的工业相机采集大量的塑料瓶图像样本,并通过HSV(hue,saturation,value)颜色空间变换和Otsu阈值分割等方法对图像进行预处理。采用随机图像变换法对数据集进行增强,并对图像进行标准归一化处理。在卷积神经网络模型中应用深度可分离卷积和Dropout技术以减少参数量,从而避免过度拟合。使用训练样本集训练该模型,并在测试集中将结果与几种经典图像识别算法进行比较分析,结果显示,本文算法的识别准确率高达约0.97。由此表明本文算法的效果优于其他经典算法,有望将其应用于化妆品塑料瓶缺陷检测的工业自动化系统,以提升缺陷识别效果,从而提高生产效率。  相似文献   

15.
为了解决语音识别中由网络加深导致的低层特征消失、参数量大及网络训练困难的问题,基于Inception V3网络的非对称卷积思想,提出了一种改进的密集连接卷积神经网络(densely connected convolutional neural networks, DenseNet)模型。根据语音识别的长时相关性,通过密集连接块建立起不同层之间的连接关系,从而保存低层特征、加强特征传播;为了得到尺度更丰富的声学特征,将卷积核的范围进行扩大;利用非对称卷积思想分解卷积核,以减少参数量。实验结果表明,相较经典深度残差卷积神经网络模型和原始DenseNet模型,提出的模型在THCHS30数据集上的语音识别性能更好,在保证识别率的情况下,还减少了网络参数量,提高了模型训练效率。  相似文献   

16.
针对现有铁路人员入侵识别准确率不高、实时性较差的问题,在YOLOv4模型的基础上提出一种R-YOLO轨道人员目标检测模型。首先,用轻量级骨干网络ResNet50代替原有的CSPDarknet53网络,利用深度可分离卷积替代PANet中的标准卷积,减少网络层数以及模型体积,加快模型的识别速度。其次,在加强特征提取网络的3个特征层分别加入有效通道注意力模块,采用K-means++聚类算法重新对数据集进行聚类和分析,提高目标检测模型的精度;在模型训练方面,采用迁移学习和混合数据集联合训练,解决人员识别精度不理想以及误检漏检等问题。最后,利用R-YOLO轨道人员目标检测模型对真实铁路人员入侵数据集进行测试。结果表明,R-YOLO模型在真实铁路人员入侵数据集上的平均识别精度达到了92.12%,较传统YOLOv4算法高出1.89%,帧速率由38.74 f·s-1提升到47.73 f·s-1。R-YOLO模型部分解决了铁路入侵人员误检漏检问题,提高了铁路人员入侵识别的实时性和准确率,为铁路安全运行提供了保障。  相似文献   

17.
为了增加主动式脑-机接口(BCI)指令集的数量,提出了一种基于运动想象和言语想象的时序编码实验范式。通过将1个运动想象和1个言语想象分时序进行,获得了4类想象方式:1)运动想象;2)言语想象;3)先运动想象再言语想象;4)先言语想象再运动想象。针对上述实验范式的脑电信号设计一种基于注意力与多尺度神经网络(AMEEGNet):首先通过一个空洞卷积和三个不同大小尺度的二维卷积提 取信号的鲁棒性时间表示;然后使用深度卷积和可分离卷积提取空间特征和频域特征;此外,在模型中添加挤压激励模块,以自适应提取具有高分类精度的特征;最后采用一个具有全连接的网络层进行分类。该模型在拥有四类想象的时序编码实验数据集上获得了71.1%的平均准确度,且在同一数据集上EEGNet,MMCNN,Shallow ConvNet,TSGL-EEGNet分别取得57.9%,60.5%,68.3%,68.4%的精度,可见所提模型识别准确率最高。  相似文献   

18.
传统人体行为识别基于人工设计特征方法涉及的环节多,具有时间开销大,算法难以整体调优的缺点。以深度视频为研究对象,构建了3维卷积深度神经网络自动学习人体行为的时空特征,使用Softmax分类器进行人体行为的分类识别。实验结果表明,提出的方法能够有效提取人体行为的潜在特征,不但在MSR-Action3D数据集上能够获得与当前最好方法一致的识别效果,在UTKinect-Action3D数据集也能够获得与基准项目相当的识别效果。本方法的优势是不需要人工提取特征,特征提取和分类识别构成一个端到端的完整闭环系统,方法更加简单。同时,研究方法也验证了深度卷积神经网络模型具有良好的泛化性能,使用MSR-Action3D数据集训练的模型直接应用于UTKinect-Action3D数据集上行为的分类识别,同样获得了良好的识别效果。  相似文献   

19.
针对目前水厂应对藻类爆发时混凝剂投加量难以确定的问题,提出一种基于深度学习的藻类混凝去除率预测方法,利用DenseNet卷积神经网络和絮体图像对藻类混凝去除率进行预测,从而对投药量进行调整 . 具体做法是,在实验室条件下对高藻水进行混凝处理,记录混凝处理后的絮体图像和对应的去除率 . 以去除率区间为标签构建絮体图像数据集,利用此数据集对 DenseNet-121模型进行训练 . 结果显示,训练后的模型对测试集的预测准确度达到了 89.5%,与 VGG 和 ResNet模型相比,利用 DenseNet模型对本文建立的数据集进行识别的精确度更高,且在识别去除率在 60%~90% 区间的絮体图像相较于其他两种模型具有明显优势. 同时通过对数据集外的铜绿微囊藻絮体图像进行识别,验证了模型具有良好的泛化性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号