首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
针对目前面向语义同步定位与地图构建(SLAM)研究大多需要已知三维对象模型作为先验知识,或者只对有限的几种物体的类别进行语义分割,而没有区分对象的个体的问题,结合目前先进的基于深度学习的实例分割算法和视觉SLAM算法提出了一种面向实例个体的物体识别和语义地图构建方法,使得机器人不仅获得了面向导航的环境几何信息,而且掌握了面向物体个体的属性和位置信息.该方法利用由视觉SLAM算法获得的图像帧间几何一致性约束来促进连续图像帧中物体匹配与识别结果,提高物体实例识别的精度,同时结合实例识别结果完成语义建图的任务.最后实现了基于视觉SLAM算法的物体实例识别与语义地图构建系统,并在ICL-NUIM数据集上进行实验,实验结果表明该系统能够基本完整地识别场景中的各种物体并生成环境的语义地图,验证了本方法的有效性.  相似文献   

2.
根据人类视觉感知理论,采用bottom-up控制策略的预注意机制和top-down控制策略的注意机制,提出了一种适用于自动目标识别的目标检测算法.该算法首先对输入图像进行非均匀区域分割,根据对象的显著性特点,在已分割好的各个区域提取出显著性点作为潜在目标点,得到潜在目标点集合,之后采用改进的双滑窗算法对这个集合进行更为细致的识别,剔除伪目标,检测出真实目标.实验表明,该算法具有良好的检测效果,预注意机制有效降低了算法运行的时间,改进的双滑窗算法使得检测的鲁棒性更强,对于目标区域带有运动阴影的红外图像以及复杂背景下的红外图像均能进行正确的检测.  相似文献   

3.
为了解决物体轮廓提取工作中,由于图像的复杂性和多义性无法依靠计算机来自动完成,而手工提取又存在速度慢、精度低、工作量大等缺点的问题,提出了一种基于粒子滤波算法的物体轮廓的提取算法,该方法可以整合各种先验信息到模型中去提高提取精度.实验证明该方法通过很少的人工交互就可以很好的提取复杂物体的轮廓.该方法为提取物体轮廓线提供了较好的解决对策.  相似文献   

4.
为了使图像分割算法通用性更强,利用高斯偏移差分过滤器模拟人类视觉机制模型寻找图像中有纹理区域,使用方向图算法界定目标边缘,最终得到图像分割结果.该算法能有效地克服图像背景上的噪声以及前景目标轮廓不明显的缺陷,成功分割提取出图像的前景目标.试验证明,该算法鲁棒性强,具有一定通用性且无需先验知识.  相似文献   

5.
结合S形聚类方法和蚁群算法的优势,将先验知识和反馈信息用于引导机器视觉的随机搜索,以找到最佳检测窗口位置,从而减少检测窗口数量、提高机器视觉在线检测效率.以电路板元器件贴片(SMT)为检测对象进行实验,结果显示:在使用阵列相机的机器视觉SMT检测中,该方案可以有效减少检测窗口的数量.  相似文献   

6.
针对人工监考摩托车驾考往往存在徇私舞弊、判断不准确等缺点,提出一种基于运动目标识别的摩托车视频监控驾考识别技术.基于改进ORB图像特征匹配算法、消除误匹配点等策略对摩托车驾考监控视频进行稳像处理;使用边缘轮廓检测的运动目标识别算法,完成运动中摩托车目标图像边缘轮廓特征检测,利用双目视觉极线约束模型对摩托车目标特征点进行立体匹配与三维重构,提高轮廓检测精度.测试结果显示,该方法检测摩托车驾考目标的最优准确率可达96%,检测算法运行的响应时间较少、实时性优,具有良好的视频监控驾考适应性.  相似文献   

7.
针对传统主动轮廓模型较低的鲁棒性能和对先验知识融合能力的不足,基于视觉注意机制的先验知识和曲线演化的理论框架,首先建立图像底层视觉显著性特征的数学模型,在此基础上提出新的曲线演化能量泛函模型,然后对该能量泛函采用变分水平集方法进行推导,得到曲线演化的偏微分方程,数值实验表明该模型相对于经典主动轮廓模型具有更强的抗噪性与分割效率.该模型的提出为进一步在主动轮廓模型中引入更高层次视觉显著性特征、得到更优越的分割模型打下了基础.  相似文献   

8.
提出了一种基于物体间关系和全局场景信息的目标检测方法.该方法利用物体的几何位置信息建立物体间的关系,并将图像的全局场景信息作为目标检测的先验知识.在2个常用的目标检测数据库上测试了方法性能.实验结果表明,所提出的方法不仅具有较好的目标检测准确率,而且具有较高的计算效率.  相似文献   

9.
基于对称差分算法的视频运动目标分割   总被引:6,自引:1,他引:5  
提出一种视频运动目标分割的改进算法, 该算法综合帧间差分算法及背景减算法获得的信息分割运动物体, 利用对称差分算法获得中间帧运动目标的轮廓信息, 以该轮廓的外接矩形为分界, 再对其外部进行动态背景更新处理, 并对其内部进行减背景运算. 实验结果表明, 该改进算法解决了帧间差分算法在运动物体缺乏足够表面纹理时, 易产生空洞和边缘缺失的问题, 具有计算速度快、 抗噪声能力强和分割效果好等优点.  相似文献   

10.
针对运动车辆在单目视觉下轮廓重构的问题,本文通过特征目标识别的方法解算出无约束运动车辆的运动参数,将无约束运动物体的轮廓重构问题转化成已知约束运动物体的轮廓重构问题,提出了一种基于视频序列的单目视觉下的运动车辆轮廓重构算法.实验结果证明,新算法能够较好地重构出不同大小车辆的3D轮廓,其车辆高度估算值的误差在4%以内  相似文献   

11.
基于边缘的字符串定位算法   总被引:1,自引:0,他引:1  
为了对强干扰噪声图像中的字符串进行实时的检测定位,该文提出了一种基于边缘的字符串定位算法,它引入了边缘密度图和边缘连接强度两个新的概念。该算法首先通过对边缘密度图进行投影分析进行自顶向下的粗定位,然后在此基础上利用垂直边缘的连接强度进行自底向上的精确定位。新算法有效地克服了噪声的影响,运算复杂度低,因而能够实现对强干扰噪声图像中的字符串的实时定位。采用该算法对集成电路芯片图像中的编号字符串进行定位,实验结果证明其在处理强干扰噪声图像时是有效的。  相似文献   

12.
长期以来,建立在坚实生理学证据之上的底-顶加工说和特征检测理论在视觉研究中占主导地位.对于顶-底加工人们只能靠一般常识,即知识或经验通过激活记忆中的神经表征影响视觉过程.但是近年来,来自人和猴的研究为顶-底的加工提供了实验证据. 首先位于猴腹侧加工系统内的物体和面孔视觉记忆表征,提供了神经编码是怎样创立、组织和再激活的最佳实验证据.联想性编码是通过学习由一些具有特殊功能的神经元建立的,这些神经元具有将时间性关联刺激的表征联系起来的能力.其次,不仅来自视网膜的底-顶信号,而且来自前额叶的顶-底信号都能触发联想性编码的提取,既可以作为有意识回忆的神经基础,又是顶-底加工影响视觉过程的基础.脑损伤病人研究、具有高时间分辨率的人类功能性核磁共振成像(functional magnetic resonance imaging,fMRI)和猴fMRI研究以及猴细胞电生理分析相结合,将进一步加强人们对视觉脑机制的全面理解.  相似文献   

13.
阅读是人们获取信息的一个极其复杂的综合心理言语过程 ,也是英语教学的主要手段。外国专家对阅读模式进行了研究 ,主要有三个阅读模式 :自下而上、自上而下、相互作用模式。笔者结合我国大学英语教学实际 ,提出对提高大学英语阅读教学的几点思考 :我们既不能照搬自上而下的模式 ,也不能照搬自上而下的模式 ,相比较而言相互作用的模式是目前较为理想的阅读模式。广大英语教师应采取切合实际的阅读教学模式以便使学生掌握真正的解码技能  相似文献   

14.
This study researches the coding model adaptive for information processing of the bottom-up attention mechanism.We constructed a coding model satisfying the neurobiological constraints of the primary visual cortex.By quantitatively changing the coding constraints,we carried out experiments on images used in cognitive psychology and natural image sets to compare the effects on the saliency detection performance.The experimental results statistically demonstrated that the encoding of invariant features and representation of overcomplete bases is advantageous to the bottom-up attention mechanism.  相似文献   

15.
从认知语言学角度出发.二语听者在自下而上及自上而下信息处理方面存在着各种困难。教师应针对这些困难,采取培养听者自下而上及自上而下两种信息处理能力的教学方式。在课堂教学上应有意识地培养学生话语感知,单词识别及策略使用的能力以体现二语听力的可教性。二语听力“可教性”的观点认为听力课堂的功能不应仅体现在丰富真实的听力内容与活泼生动的教学形式上,也不能仅止于提供机会让学生练习听力。二语听力课堂的功能应更深层次地体现在培养学生对自己听力能力的责任意识及驾驭能力上。  相似文献   

16.
Knowledge or experience is voluntarily recalled from memory by reactivation of the neural representations in the cerebral association cortex. In inferior temporal cortex, which serves as the storehouse of visual long-term memory, activation of mnemonic engrams through electric stimulation results in imagery recall in humans, and neurons can be dynamically activated by the necessity for memory recall in monkeys. Neuropsychological studies and previous split-brain experiments predicted that prefrontal cortex exerts executive control upon inferior temporal cortex in memory retrieval; however, no neuronal correlate of this process has ever been detected. Here we show evidence of the top-down signal from prefrontal cortex. In the absence of bottom-up visual inputs, single inferior temporal neurons were activated by the top-down signal, which conveyed information on semantic categorization imposed by visual stimulus-stimulus association. Behavioural performance was severely impaired with loss of the top-down signal. Control experiments confirmed that the signal was transmitted not through a subcortical but through a fronto-temporal cortical pathway. Thus, feedback projections from prefrontal cortex to the posterior association cortex appear to serve the executive control of voluntary recall.  相似文献   

17.
现有的无监督对象检测模型采用线性模型引入自顶向下的对象信息。由于对象的多变性及背景的复杂性,线性模型无法很好地刻画局部区域的对象信息。本文采用非线性模型学习引入对象性,同时采用了一种结合的策略引入对象的显著信息,以实现对象的检测。我们采用著名的Pascal图像库以提供广泛的对象样本,基于核的支持向量机则用于非线性模型的学习。实验结果,表明本文方法能够改善对象检测的性能。  相似文献   

18.
提出了一种基于注意机制的图像识别模型。其基本想法是:在进行复杂的场景分析或目标识别时,首先通过注视控制机制,获得视景中的关键特征区域,并将注视点按照一定的顺序对这些关键特征区域进行串行扫描。  相似文献   

19.
针对已有的仿生动作识别系统计算量大、耗时长的问题,提出了在系统中加入注意机制的方法.该方法模仿注意机制在人类视觉中所起的重要作用,将视频中运动目标的活动区域作为视频图像的显著区域划分出来,然后结合视频图像的显著区域获取不同动作的特征模板.此方法在一定程度上克服了视频的背景噪声对系统性能的影响,同时更准确地模拟了人类视觉机制.实验结果表明:该方法能较好地改善人体动作识别模型的识别速度和识别结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号