首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
单幅图像的目标检测和物体姿态估计一直是计算机视觉领域中非常重要的研究内容.利用卷积神经网络对单幅室内场景图像进行研究分析,提出了一种基于卷积神经网络的单幅图像室内物体姿态估计算法.该算法采用直接分类预测的方法来实现物体的姿态估计.通过改进Faster-RCNN网络结构,利用室内场景数据集SUNRGB-D训练网络,实现端到端单幅室内图像目标检测和姿态估计.实验结果表明,该算法目标检测平均准确度为70%,姿态估计结果中平移估计准确度为28%,旋转角度估计准确度为30%.  相似文献   

2.
基于双目视觉技术的物体深度信息的提取   总被引:1,自引:0,他引:1  
传统的双目匹配算法得到的数据是左右视图匹配点的二维坐标;但二维坐标将丢失物体的三维深度信息。提出一种利用视差原理在世界坐标系内计算该物点在现实中所对应点的三维坐标的新方法。该方法分为三部分:第一部分为双目相机的标定,包括内参(主点、焦距、径向畸变、不垂直因子)以及两相机之间的外参(旋转矩阵和平移矩阵)。第二部分为特征点的提取与匹配,特征点的提取则是利用SIFT算子提取左右视图的特征点,匹配则是将两视图中的对应点(现实中为同一点)利用SIFT算法进行匹配。第三部分为物体深度信息的计算,利用双目相机的视差原理和已经得出的双目相机的参数进行空间还原得到相应的左右视图投影投射矩阵,结合空间几何线性关系计算出该点在世界坐标系的三维坐标,从而得出其深度信息。  相似文献   

3.
综合利用彩色和深度信息,采用多数据模式的特征提取策略,提出一种基于卷积-递归神经网络和费舍尔向量的RGB-D 物体识别方法. 对于彩色图像和深度图像,分别利用卷积-递归神经网络和卷积-费舍尔向量-递归神经网络提取物体的纹理及形状特征. 为了更加全面的获取物体信息的特征表述,引入了灰度图像和表面法向量作为原始数据的补充,并利用卷积-递归神经网络提取特征. 最后,将4 种数据模式下提取到的特征融合起来,输入到softmax 分类器中实现RGB-D 物体识别. 在标准的RGB-D 数据库中对算法进行验证,所提算法可以有效提高物体识别率.  相似文献   

4.
为了从物体的二维图像参数中得到三维重构模型,需要通过相机内部参数,建立真实物体与对应成像物体的关系模型,提出一种借助双平面镜进行三维重构的相机自动标定算法.通过两个普通平面镜获取被摄物体的5个不同角度二维图像投影,自动标定算法依赖物体的投影轮廓线计算相机内部参数.试验结果表明,通过相机自动标定算法获取轮廓和相机的参数信息,能有效地实现基于视觉外壳算法的三维重构.  相似文献   

5.
提高储层预测的分辨率和准确性一直是油气藏表征的一个关键问题。将频谱分解与深度学习相结合,提出基于小波变换和卷积神经网络的地震岩性、储层类型预测方法。小波变换能够提供包含高频和低频信息的二维时频谱图,卷积神经网络具有超强的二维图像特征提取和分类能力,时频谱图作为卷积神经网络的输入,有助于充分挖掘地震数据高频和低频信息进行岩性和储层预测。将提出的方法应用于川西沙溪庙组储层预测中,首先利用叠后地震数据预测得到河道砂体分布,然后利用叠前地震数据在河道内部预测储层类型分布。结果表明,深度学习反演预测岩性和储层类型的分辨率和精度更高,能够识别小河道砂体,与生产测试情况更加吻合,优于常规地震反演方法。  相似文献   

6.
研究的是数码相机在交通管制中定位物体特征点的优化设计问题.将数码相机成像问题简化为针孔成像问题后,研究了靶标图像与数码相机像平面上图像间的旋转和平移关系,为了使二维图像获取三维信息,建立起图像间的透视投影模型.利用该模型,通过确立标定点与相应的二维图像坐标,运用最小二乘法求解投影矩阵,实现对相机内、外部参数的标定.标定过程中,运用数字图像处理技术,对图像进行二值化处理,提高了数据的准确度和科学可信性,由此解得较为精确的内、外部参数,获得基于此模型的圆心在像平面的坐标表示,分别为A(321,189)、B(422,196)、C(639,212)、D(582,502)、E(284,501).使用BP神经网络方法对已建立的模型进行检测,通过对比BP神经网络与透视投影求得圆心值与实际圆心值的均方根误差,论证了该模型有较高的精度和稳定性.并基于已有工作,建立了双目视觉定位模型,得到两部相机间的相对位置关系.在模型的进一步讨论中,研究了椭圆中心偏移问题,时像平面上椭圆的中心坐标进行了修定,得到实际的中心为:A(325,191)、B(427,201)、C(642,216)、D(584,504)、E(288,505).以及讨论了图形的畸变问题,确定了相应的关系.  相似文献   

7.
为了从物体的二维图像得到三维重构模型,需要通过相机内部参数,建立已知物点、像点对应的关系模型.提出一种基于双平面镜的相机标定算法,用两个普通平面镜取得物体5个不同角度的二维图像,通过基于颜色信息和基于区域背景差的方法获取目标轮廓,用多边形动态规划算法获取轮廓的特征点以确定各个物体轮廓的对应点,最后根据特征点得到相机内部参数.多边形动态规划算法将时间复杂度从O(n3)降低到O(n2),算法的效率得到提高.  相似文献   

8.
为了使计算机具有与人类相似的在复杂背景下识别一般物体的视觉处理能力,提出了一种基于立体视觉的一般物体识别方法.该方法的核心在于融合二维图像信息和双目相机获取的深度信息,对视野中的环境进行物体定位、图像分割、特征描述以及物体识别.通过双目相机获取环境的三维点云信息,并利用mean-shift算法进行聚类,剔除干扰点,从而实现物体在二维图像上的定位与分割.利用含有空间关系的BoW模型对分割后独立区域内的物体进行识别,得出判别结果.此外,在利用sift算法进行特征点提取以及利用mean-shift算法进行聚类的环节中,采用CUDA环境下的GPU进行加速处理,提高了处理速度.实验结果表明,所提方法具有较好的识别效果和鲁棒性.  相似文献   

9.
针对平面图像特征选择,提出一种结合学习特征的改进图像矩视觉伺服方法,以解决不变图像矩特征存在的交互矩阵奇异问题并获得更优的运动特性.该方法首先基于不变矩特征具有的TRS(2D平移、2D旋转及尺度变化)不变特性,利用非线性支持向量机回归算法,对不变矩特征与摄像机X轴、Y轴转角的关系进行分别学习建模;然后利用两个模型的估计值(即学习特征)作为针对X轴旋转及Y轴旋转运动的图像特征,其交互矩阵具有完全解耦及线性特性,且对于任意平面目标不存在奇异问题;进而结合目标图像重心点坐标和面积的归一化特征及图像方向角特征,实现摄像机在任务空间的平移及旋转六自由度控制;最后通过仿真验证了文中方法的有效性.  相似文献   

10.
针对基于神经网络的在线目标跟踪方法容易丢失历史信息的问题,提出了一种基于改进卷积神经网络的在线视觉目标跟踪方法.首先利用卷积神经网络来表示物体的外观,基于树结构用多个卷积神经网络协作来估计目标物体的状态,并且为在线模型的更新设定理想路径.其次,通过维护树结构中不同分支的多个卷积神经网络来有效处理物体外观的多模态,并通过树路径的平滑更新来维持模型的可靠性,同时在卷积层共享所有的参数,从而以最小的额外代价充分发挥多模型的优势.最后在多模型状态附近进行抽样,依据加权平均确定最佳样本估计值.仿真实验表明,与现有算法相比,该算法具有更好的在线跟踪性能.  相似文献   

11.
在描述刚体角运动时,四元数这一数学工具弥补了三个欧拉参数在设计现代控制系统时的不足.通过研究方向余弦矩阵的若干代数性质,从矩阵代数的角度证明:姿态四元数中的旋转轴恰是方向余弦矩阵的特征值1所对应的唯一的单位特征向量;另外旋转角通过方向余弦矩阵的迹算出.从而给出由特征值法求解姿态四元数的算法.  相似文献   

12.
为满足配电线路维护机器人更换避雷器的作业需求,提出了一种基于全卷积神经网络的横担姿态测量方法.通过分析三维几何特征建立了横担姿态模型;采用基于全卷积神经网络的图像分割方法获得横担区域,并以此作为掩膜进行边缘检测,去除环境干扰;采用基于投票法和霍夫空间约束的直线检测提取横担主体区域轮廓直线,并给出了求解横担姿态向量的算法.实验结果表明:所提出方法能较为精确地测得横担姿态,为机器人自主更换避雷器奠定了良好基础.  相似文献   

13.
随着深度学习的发展,卷积神经网络在各种视觉任务中都具有优越的性能;特别是在二维图像分类上,更是获得了很高的分类精度。针对于高光谱图像分类问题,设计了一种新的卷积运算;利用高光谱图像谱-空联合信息建立三维卷积神经网络对其进行分类;并针对高光谱图像样本不均匀性,在网络输出不同类别加入不同的权重加以训练。通过对两个公开高光谱图像数据集的测试,相对于传统方法,能够得到更高的分类精度,表明卷积神经网络对高光谱图像具有更强的特征表达能力。  相似文献   

14.
详细推导了从二维图像获取物体三维信息的算法,提出了用正交化方法求解视见变换阵及三维信息的实现方法,并对解进行了迭代改进,误差分析表明,该算法为船舶操纵模拟器三维视景的生成提供了一种有效的方法。\  相似文献   

15.
为了进一步提高三维模型的识别精度,提出了一种基于深度卷积神经网络的三维模型识别方法。将点云数据通过占用网格规范化计算转化为二值3D体素矩阵,通过附加正则化项的随机梯度下降算法提取体素矩阵的特征,再通过共享权重的旋转增强对训练集进行数据增广并以此对模型标签进行预测。实验结果表明,该算法在公开数据集ModelNet40及悉尼城市模型数据集上的识别精度均达到85%左右。与基于同类机器学习的三维模型识别算法相比,在相同训练数据集上该方法网络训练时间短,在相同测试数据集上模型识别准确率高,检索速度快。提出的体素占用网格模型的深度卷积神经网络,可以实现三维点云模型数据集及规范化体素模型数据集的识别和分类工作。  相似文献   

16.
足球正脚背射门动作实时变化,不同时刻目标二维图像存在很大差异,当前三维姿态重构方法可得到的动作信息非常有限且具有姿态敏感性,导致重构结果不可靠、连续性不高。为此,提出一种新的足球正脚背射门动作的三维姿态重构方法,依据足球正脚背射门动作图像中所有像素的平均梯度平方矩阵获取Harris算子,通过Harris算子对足球正脚背射门动作特征进行提取。通过矩阵因式分解方法从观测矩阵中分解出三维姿态位置矩阵,实现足球正脚背射门动作三维姿态重构。实验结果表明,所提方法具有很高的重构精度,且连续性较高。  相似文献   

17.
由于三维模型的项点坐标是不成比例的,这导致了三维模型的分块比二维图像难的多.然而水印分块是很容易的.因此本文提出一种新的三维网格模型分块算法,通过插入特殊的字符来将水印信息分块.然后用具有高安全性的混沌映射来加密分块的水印信息.试验结果显示,本文提出的算法能够检测出模型的任何篡改并且能够定为篡改区域.该算法简单、有效、具有高安全性.  相似文献   

18.
单目视觉位姿测量过程中,被测物体与摄像机光轴之间的夹角随着姿态的变化而变化,并受到环境噪声、提取算法和摄像机等因素的影响,像平面的像点坐标存在不可忽略的误差,单目多角度标识点三维坐标测量方法实现了位姿测量过程和坐标测量过程的统一,能够减小图像中心提取误差的影响.本文研究了单目视觉位姿测量的误差传播模型,从摄像机图像误差出发,预测和估计输出姿态误差,选取最适合的单目多角度定位标识点坐标,实验结果证明本文提出的基于误差传播的定位标识点坐标优选方法能够有效地提高单目视觉位姿测量的精度.  相似文献   

19.
为解决三维点云数据存在复杂的点云孔洞、对后续处理造成影响的问题,提出一种基于经纬网格的点云修补算法。首先将点云的三维坐标转换到球坐标系,形成三维球体,并对球体进行经纬网格的区域划分;然后找出每一个网格区域对应的点云三维坐标点,并求出点的密度;最后,利用密度较小区域邻近区域的点进行样条插值,来填补孔洞,实验证明了该算法的稳健性,恢复复杂物体的表面信息效果较好。  相似文献   

20.
针对传统视觉伺服控制算法易使目标物品脱离摄像机视野而致伺服失败的缺点,从表征当前摄像机坐标系与期望摄像机坐标系姿态关系的旋转矩阵中分解出了等效转轴和等效转角,利用它们构造了一种可以有效控制摄像机朝向的任务函数矢量,并推导出了表征任务函数矢量变化量与摄像机运动速度间非线性映射关系的雅可比矩阵。然后构造了任务函数,并根据李雅普诺夫第二方法设计了解耦的视觉伺服控制律,最后对所设计的控制律进行了实验验证。实验结果表明,使用旋转矩阵分解方法构造的任务函数矢量来控制摄像机朝向,可使目标物体始终位于摄像机的视野之内,从而有效避免伺服失败。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号