首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 640 毫秒
1.
针对单张RGB-D图像进行六自由度目标位姿估计难以充分利用颜色信息与深度信息的问题,提出了一种基于多种网络(金字塔池化网络和PointNet++网络结合特征融合网络)构成的深度学习网络框架.方法用于估计在高度杂乱场景下一组已知对象的六自由度位姿.首先对RGB图像进行语义识别,将每一个已知类别的对象掩膜应用到深度图中,按...  相似文献   

2.
李健  赵丽华  何斌 《科学技术与工程》2020,20(11):4458-4463
机器人抓取场景中经常包含许多具有回转结构的物体,然而由于这些物体不存在已知的三维模型,无法快速高效地确定回转体形状和位姿。针对这个问题,在现有的基于单视图回转体建模方法的基础上,将位姿估计和重建过程结合,提出回转体形状恢复与位姿估计的方法。首先利用训练好的整体嵌套的边缘检测(holistically-nested edge detection,HED)网络模型得到图像中回转体的边缘轮廓并进行细化处理,再与传统边缘检测方法相融合,提取回转体轮廓信息;其次,根据回转体成像特殊几何约束,依据单张回转体照片建立比例模型;最后,利用同一回转体不同角度的两张图像估计其尺度与位姿。通过实验表明,该方法能够通过两张同一回转体的照片,估计回转体的真实尺度与空间位姿,同时不需要点云信息,是一种鲁棒性较好的回转体形状恢复与位姿估计方法。  相似文献   

3.
基于视觉的智能车辆定位问题是自动驾驶领域研究的一大热点。在某些有效近景特征不显著的场景中,由于参与计算的特征数量不足,会导致位姿估计精度下降甚至失效。为此,本文提出一种结合车道线检测的相机位姿估计方法来提高位姿估计精度。首先,设计了一套基于自适应感兴趣区域和几何结构筛选法的车道线检测算法,精确检测到了左右车道线的内、外侧线;其次,对车道线区域内的点进行帧间匹配,得到新的匹配点对,并根据V视差图拟合出地面视差方程,求解出属于车道线匹配点对的准确视差值;最后,将这些匹配点对与ORB方法提取得到的匹配点对融合,共同参与相机的位姿计算。经实验验证,本文提出的算法提高了位姿估计结果的精度,解决了某些场景中有效特征点不足导致的位姿估计失效问题,具有良好的环境适应性。  相似文献   

4.
室内动态场景下的同步定位与地图构建(simultaneous localization and mapping, SLAM)系统容易受到运动障碍物的影响,从而导致其位姿估计精度和视觉里程计的稳定性降低。本文提出一种基于YOLOv4目标检测网络的视觉SLAM算法,获取语义信息,并利用LK光流法判断动态特征,在传统的ORB-SLAM2系统上将动态特征点剔除,只使用静态特征点来估计相机的位姿;建立稠密点云地图,并转化成节约内存空间的八叉树地图。在TUM公开数据集上对该方法进行测试和评估,实验结果表明:在动态环境下,该系统与ORB-SLAM2相比,相机位姿估计精度提高83%,且减少了生成的环境地图的存储空间,为后续实现机器人导航具有重要意义。  相似文献   

5.
针对无序分拣场景中物体相互堆叠遮挡导致的位姿估计误差大的问题,本文提出了一种基于点对特征(point pair feature, PPF)的杂乱堆叠工件位姿估计算法。离线训练阶段,使用更优的点云降采样方案和更为细致的点云法线计算方式,以保留更多具有区分性的点对,实现模型更为精确的全局描述;在线匹配阶段,通过快速投票方案获得杂乱堆叠场景中目标的候选位姿,并提出了一种基于体素索引和位姿交并比的聚类策略完成位姿聚类和误匹配位姿的剔除,实现目标位姿的粗估计,最后采用ICP (iterative closest points)算法完成目标位姿的优化,获得目标的精确的6D位姿。分别进行了仿真场景实验和机械臂分拣实验,结果表明,提出的算法在杂乱场景中对3种类型工件的平均识别率为98.4%,单个工件识别时间均小于0.86s,且位姿估计精度较原始PPF算法有明显提升;在实际分拣实验中识别成功率达96.7%,分拣成功率达95.3%,验证了算法在实际应用中对于噪声和杂乱遮挡的鲁棒性较强。  相似文献   

6.
为了在未知物体三维模型的情况下使用深度学习进行平面位姿估计,采用编码器-解码器网络,从单个RGB图像中检测平面实例分割及法线信息,并利用这些信息进行位姿解算,获得每个平面的实时位姿。实验结果显示,平面召回率为0.625,平面法线召回率为0.414,实时性为18.5 f/s,验证了算法的可行性。  相似文献   

7.
刘畅 《科学技术与工程》2024,24(7):2782-2789
为了提高ORB-SLAM2系统的位姿估计精度并解决仅能生成稀疏地图的问题,提出了一种融合ICP算法与曼哈顿世界假说的位姿估计策略并在ORB-SLAM2系统中加入稠密建图线程来实现稠密建图。首先通过ORB特征点法、LSD算法和AHC方法进行点、线、面特征的提取,其中点、线特征跟上一帧匹配,面特征在全局地图中匹配。然后采用基于surfel的稠密建图策略将图像划分为非平面与平面区域,非平面采用ICP算法计算位姿,平面则通过面与面的正交关系确定曼哈顿世界从而使用不同的位姿估计策略,其中曼哈顿世界场景通过位姿解耦实现基于曼哈顿帧观测的无漂移旋转估计,而曼哈顿世界场景下的平移以及非曼哈顿世界场景位姿采用追踪的点、线、面特征进行估计和优化;最后根据关键帧和相应位姿实现稠密建图。采用TUM数据集对所提建图方法进行验证,实验结果与ORB-SLAM2算法比较,最终均方根误差RMSE平均减少0.24cm,平均定位精度提高7.17%,验证了所提方法进行稠密建图的可行性和有效性。  相似文献   

8.
基于点对特征和局部参考系的六维位姿估计算法   总被引:1,自引:0,他引:1  
针对大量物件分拣工作中单目视觉无法精确估计目标位姿从而无法完成随机堆叠工件分拣的问题,以点对特征为基础,提出了基于点云的目标识别和位姿估计算法的改进算法.模型训练阶段,使用改进的下采样方法,保留更多有区分性的点对,构建局部参考系作为补充特征;在线匹配阶段,以距离作为投票权重,并利用匹配点对的局部参考系相似度验证候选位姿;最后通过模型与场景的重叠率筛选未遮挡的多实例目标作为可抓取目标候选.结果表明:在方差为3%,5%倍模型尺寸的高斯噪声下,目标识别率分别可达97%,78%;所有试验的识别耗时均在1 s以内,满足实际需求.  相似文献   

9.
张利  陈鹤  边桂彬  李桢 《科学技术与工程》2023,23(32):13903-13909
基于术中影像的运动感知是计算机辅助手术系统开发的重要研究内容,能够为运动补偿、软组织形变分析等应用提供有价值的信息,从而提高手术效率并增强手术安全。然而,手术影像中运动器械的遮挡降低了对局部区域估计的准确性。为解决这一难题,提出一种基于光流网络和解耦表示的运动感知方法,并结合自监督学习范式优化模型。制作了神经外科手术数据集,在PyTorch深度学习框架下对模型进行训练和验证。实验结果表明:该运动估计方法在复杂手术场景中具有稳定性强、准确度高的优点,在计算机辅助手术中具有较高的应用价值。  相似文献   

10.
参考数据的纯度影响着地面数字广播多媒体(DTMB)外辐射源雷达的探测能力,而参考信道估计的精度是影响参考数据恢复的关键因素。针对此问题,文章将基于深度学习理论的信道估计方法引入外辐射源雷达参考信道估计过程。利用自回归模型对参考信道进行建模,并搭建参考信道估计网络。通过迭代训练后,估计得到参考信道响应。相比于传统算法,基于深度学习的参考信道估计精度得到有效提升,改善了雷达的探测性能。  相似文献   

11.
基于独立子空间分析(ISA)技术,提出了一种多视角人脸姿态估计算法。给出了ISA视角子空间分析公式和有效的多视角子空间有监督学习算法。基于有监督学习的多视角人脸模型子空间学习算法,能够实现比无监督ISA学习算法得到更高的姿态估计精度。  相似文献   

12.
提出一种改进的最大互信息(MMI)准则函数并把它应用于隐马尔可夫模型(HMM)的参数估计,重新推导了HMM的迭代公式. 该准则函数相对于原来准则函数定义更为合理,能有效利用训练样本集中的鉴别信息,使得训练数据得到充分利用,提高了HMM的性能. 把这种改进的HMM算法应用于面部表情识别,利用改进的光流算法提取面部表情特征向量序列,并利用改进HMM算法和BP神经网络构建了面部表情混合分类器. 实验结果表明了该方法能有效提高面部表情识别率,有效解决HMM参数估计问题.  相似文献   

13.
负荷估计和状态估计对于配电网的管理和控制非常重要.文中提出了一种集成的负荷估计和状态估计框架.一方面提出了一种基于连接机制的事例推理新方法(CBCBR)用于解决配电网节点负荷估计问题,分别介绍了CBCBR的原理、结构、混合学习算法和实际应用,CBCBR具有快速、增量式、自适应学习能力;另一方面提出了一种抗差状态估计方法,同时实现了结构空间和量测空间的抗差.抗差状态估计器使用CBCBR的输出作为输入的伪量测量,同时CBCBR可使用抗差估计器的输出改善其自身性能.所提集成的负荷估计和状态估计框架能有效抵御坏数据的影响,并可实现自适应性调节.使用33节点系统测试所提方法,所用节点数据来自实际系统,算例结果证明了读方法的有效性.  相似文献   

14.
为了实现视频中特殊人群跌倒检测的实时性和降低误检率。通过采用改进的姿态估计网络提取人体关节点的方法,研究了使用前后帧关节点的变化来对人体进行追踪和跌倒行为检测。为了在嵌入式平台上使姿态估计网络达到实时效果,采用带有注意力机制的轻量化结构搭建深度卷积网络来提取人体关节点坐标,并合成完整的骨架信息。结果表明:带有注意力机制的姿态估计算法在不同数据集上的准确度均有提升;同时在嵌入式平台上保持误检率较低的情况下达到实时跌倒检测。可见基于改进姿态估计算法并通过关节点判断的方法较好地实现了人体的跌倒检测。  相似文献   

15.
针对光场深度估计网络结构中运算时间较长的问题,设计了一种能够被重参数化的多分支串联残差块结构(Res-DBLB),加快了网络运算速度,同时引入复合卷积块(RepConv)和卷积注意力模块(CBAM),优化网络性能.对于复杂的遮挡场景,利用深度图生成遮挡掩码,计算遮挡感知成本的构造函数,消除遮挡的负面影响.实验结果表明:与传统方法相比,该算法的均方误差和坏像素率更低,推理速度更快,同时在复杂遮挡场景中表现出较高的稳健性.  相似文献   

16.
单目深度估计研究是许多视觉任务的基础,从图像中得到边缘清晰,细节丰富的深度图对于后续任务具有重要的作用。针对当前单目深度估计模型中不能深度融合图像语义信息以及不能较好地利用图像对象的边缘信息问题,首先构建了超像素拓扑关系图,使用图神经网络提取局部边缘信息之间的相互关系,得到以超像素为节点的拓扑关系图,其次构建了基于编解码结构的深度估计与语义分割的联合模型,通过优化联合目标函数,使模型能够融合边缘语义信息,从而提高模型提取局部结构信息的能力。通过在NYU-Depth V2 数据集中进行实验验证,结果表明模型能够构建细节丰富边缘清晰的深度图,提高了单目深度视觉估计的质量,与其他模型相比,该模型具有一定的优越性。  相似文献   

17.
基于表观的视线估计方法主要是在二维的三原色(red green blue,RGB)图像上进行,当头部在自由运动时视线估计精度较低,且目前基于卷积神经网络的表观视线估计都普遍使用池化来增大特征图中像素点的感受野,导致了特征图的信息损失,提出一种基于膨胀卷积神经网络的多模态融合视线估计模型.在该模型中,利用膨胀卷积设计了一种叫GENet(gaze estimation network)的网络提取眼睛的RGB和深度图像的特征图,并利用卷积神经网络的全连接层自动融合头部姿态和2种图像的特征图,从而进行视线估计.实验部分在公开数据集Eyediap上验证了设计的模型,并将设计的模型同其他视线估计模型进行比较.实验结果表明,提出的视线估计模型可以在自由的头部运动下准确地估计视线方向.  相似文献   

18.
提出了一种有效的降维构建方法改善来波到达角(DOA)估计的性能。该方法利用局部保持投影(LPP)对DOA估计用的神经网络的训练样本进行降维,以降低神经网络的复杂度,加快神经网络的训练过程。与常用的协方差矩阵上三角特征相比,在不损失有效方位信息的基础上,可以使特征维数极大地降低。数值实验表明,基于局部保持投影和神经网络的方法具有良好的估计精度和效率,同时对噪声也有较强的适应能力,能够很好地满足波达方向估计实时性的要求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号