首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
传统视觉问答技术仅采用简单的位置注意力,缺乏语义注意力,从而引起问题推理错误.本文采用双重注意力机制从图像获取位置信息和语义信息,以外积形式进行融合,获得文本也采用双重注意力融合实体和对应关系的信息,帮助理解问题.双重注意力动态方式可以实现关系融合、动态学习,改变传统静态学习方式.以多标签分类器实现答案推理,减少传统二...  相似文献   

2.
人类视觉注意力模型的研究结果表明,颜色特征、方向特征等底层特征是影响人类视觉注意力的重要特征。最近学术界提出了一些基于全局对比的显著性检测算法,但是这些算法仅涉及到颜色这一底层特征,而没有使用方向特征。这就影响了这类算法对方向特征对比度强而颜色特征对比度弱的图像的检测性能。因此,本文提出了一种基于图像方向特征全局对比的显著区域检测算法。首先,将图像过分割为若干不规则的超像素作为图像显著性计算的基本单元,把图像超像素的LBP(Local Binary Patterns)统计直方图作为该超像素方向特征的描述。然后,计算图像超像素的方向特征的独特性和方向特征的分布性。根据图像超像素的方向独特性和方向分布性计算超像素的显著性。最后,将显著性值分配到图像的每一个像素点上。在现今国际最流行的两个数据集上进行实验的结果表明,该算法可以有效弥补只使用颜色特征的显著性检测算法的不足,从而达到较好的检测效果。  相似文献   

3.
为了快速搜索场景中的重要目标,依据人类视觉系统的特点,提出了一种基于颜色信息相位谱的显著性检测模型. 通过分析图像颜色相位谱信息,建立显著性图谱,它能够表示出场景中重要目标的位置. 实验结果表明,在复杂背景下,该算法能够较好地检测出和人类视觉相一致的重要区域.  相似文献   

4.
计算机视觉检测技术的发展及应用研究   总被引:8,自引:0,他引:8  
图像分割是图像处理与计算机视觉的基本问题之一,本文就图像分割的具体内容及常见的图像分割方法进行了综述。介绍了计算机视觉技术的研究内容、研究方法,说明了计算机视觉技术在图像采集系统、立体视觉测量系统、汽车车身视觉检测系统及逆向工程中的典型应用,分析了计算机视觉技术发展过程中存在的问题。  相似文献   

5.
为了解决目前抠图算法的采样不充分问题,提出了一种在视觉显著信息指导下的采样,并通过可信度计算确定样本可用性的自然图像抠图算法SIGM.该算法将视觉显著模型引入采样过程,以显著图为指导重点采集区域内的颜色显著样本点.综合分析候选样本对的可信度,将是否符合线性假设、颜色空间内的距离、局部显著性等作为评判依据,选择具有高可信度的样本对来估计透明度值.使用抠图拉普拉斯矩阵作为代价函数的平滑项,优化估计透明度值,得到最终的图像掩膜.实验结果验证了该算法的有效性和准确性.  相似文献   

6.
针对目前图像显著性检测存在的显著性图边缘模糊、缺乏视觉高层信息等问题,提出了一种基于物体信息的显著性检测算法。将似物性计算与显著性计算相结合,可以将前景与背景分离,抑制高对比度干扰区域的影响。首先采用改进的L0平滑算法对图像进行滤波处理,然后通过超像素分割将图像分成若干图像块,再通过聚类算法进行合并,得到待检测图像块。采用似物性检测算法计算物体可能存在的区域,与待检测图像块进行融合,得到物体显著性图,再通过颜色对比度及空间分布特征计算显著性图,最后将二者融合,得到最终结果。实验结果表明,算法能够得到清晰的物体边缘,对图像的显著性区域能够较为全面地覆盖,有效地抑制高对比区域的干扰。  相似文献   

7.
为了解决传统视觉显著性模型在复杂现实场景中容易失效的问题,提出了一种融合运动和空间关系特性的显著性检测方法.在颜色对比度的基础上,引入图像中目标的空间深度关系和运动特征.首先建立深度显著性模型,并使之与颜色显著性融合获得空域显著图;然后通过分析运动矢量得到运动特征显著性,并采用加性融合和乘性融合联合的方式计算出最终的显著图.实验分析建立在多个立体图像数据库之上,量化评价和视觉观测均表明:本方法可以有效地提取显著性区域,检测效果优于传统方法.  相似文献   

8.
张帆 《科学技术与工程》2013,13(26):7688-7691,7696
为了进一步提高图像的压缩率,提出了基于心理视觉冗余和主成分分析(PCA)的图像压缩算法。根据人类视觉处理过程中各种信息的重要程度不同的原理,在不影响图像的感知质量的前提下,通过消除不重要的心理视觉冗余信息;再用PCA对消除心理视觉冗余的图像做进一步降维,使得图像数据进一步压缩。通过实验结果可知,提出的新的压缩算法在不影响图像感知质量的前提下,使得图像压缩比提高了1倍,大大缩小了存储空间。  相似文献   

9.
图像质量评价在图像处理领域有着广泛的应用.基于深度学习的方法以多通道特征的形式获取图像信息,但在特征下采样过程中会丢失局部空间细节,导致对于图像信息的表征能力不足.针对以上问题,本文基于人类视觉系统的分层感知机制,提出了一种全参考图像质量评价方法,采用Siamese结构的卷积神经网络实现非线性映射,从不同尺度和视觉复杂度表征图像信息,并通过双重注意力模拟人类在评价图像质量时对视觉注意力的调控过程.此方法在特征提取阶段引入空间注意力机制,对特征图的二维空间位置赋以权重,计算人在感知图像失真信息时对空间区域的注意力差别.在特征融合阶段利用分组通道注意力模块显式建模通道间的依赖关系,对感知差异特征进行自适应的校准,使网络关注对于图像质量评价影响大的通道特征.实验结果表明,该方法在LIVE、TID2013和CSIQ3个公开数据集上的斯皮尔曼相关系数分别达到0.975、0.938和0.963,在应对复杂失真类型图像时的性能提升显著,与人类主观评价的一致性良好.  相似文献   

10.
图像检索中的对称性分析   总被引:1,自引:0,他引:1  
信息产业的迅猛发展 ,使得图像信息急剧增加。图像视觉特征描述是其中的重要内容。该论文简介了目前图像对称性分析的发展情况 ,定义了计算机视觉中的对称性模型 ,综合了目前国际上比较流行的对称性检测的方法 ,并且论述了利用相位一致进行对称性检测的方法 ,从而进一步提高基于内容图像检索方法的有效性和实用性。  相似文献   

11.
This study researches the coding model adaptive for information processing of the bottom-up attention mechanism.We constructed a coding model satisfying the neurobiological constraints of the primary visual cortex.By quantitatively changing the coding constraints,we carried out experiments on images used in cognitive psychology and natural image sets to compare the effects on the saliency detection performance.The experimental results statistically demonstrated that the encoding of invariant features and representation of overcomplete bases is advantageous to the bottom-up attention mechanism.  相似文献   

12.
未来战争具有高复杂性,来自战场复杂信息界面的大量视觉信息输入对决策人员带来巨大挑战。立足人类视觉信息感知特点和视觉显著性机制相关理论,提出以色调、饱和度、明度、图像梯度等关键视觉信息感知特征为自变量的评估方法,采用复杂影像地图下的目标识别任务,建立以视觉搜索响应时为指标的视觉搜索效能量化评估模型。实验结果表明,基于3种地貌(城市、海洋、高原)下不同对比度和亮度的441张影像地图实验数据生成的量化模型,可以良好地拟合被试的行为响应时(R2= 0.232,p<0.001)。  相似文献   

13.
 视觉是人们感知外部世界最重要的途径之一。视觉信号通过视网膜接收后传递到大脑皮层进行加工处理,最终形成人们所意识到的画面。目前为止,已有大量研究从不同水平不同角度探讨大脑如何对视觉信息进行加工和表征,但仍有很多未解的问题。本文综述了视觉信息加工的研究进展,回顾了脑视觉信息加工过程及组织形式,总结了近年来有关视觉可塑性、知觉学习、生物社会信息知觉等方面的研究进展。  相似文献   

14.
提出了一种基于注意机制的图像识别模型。其基本想法是:在进行复杂的场景分析或目标识别时,首先通过注视控制机制,获得视景中的关键特征区域,并将注视点按照一定的顺序对这些关键特征区域进行串行扫描。在扫描到每一个关键特征区时,将对该区域附近的局部模式进行记忆或匹配。对一个复杂目标的记忆将包括2部分,一部分是对局部模式的记忆,即组成该目标的各“部件”的模式;另一部分是对各局部模式之间的空间关系的记忆,即组成该目标的各“部件”之间的结构关系。与记忆过程对应,识别过程也包括2部分,一部分是对局部模式的匹配,另一部分是对各局部模式之间结构关系的匹配。当匹配上的局部模式足够多且其空间关系正确时,目标即得到识别。用该模型对复杂背景中的人像进行了检测。实验结果表明,模型较好地解决了不变性识别的问题,即识别结果与目标物的平移、旋转和尺度变化无关,并且具有良好的鲁棒性和速度,是一种具有认知意义并且可以实用化的模型。  相似文献   

15.
可视化语言与语言可视化   总被引:1,自引:0,他引:1  
可视化语言是人与计算机之间直观理解、直观通讯的一种有效机制 ,该领域的研究受到广大计算机工作者的重视 计算机科学的一些领域 ,如数据库、多媒体、人工智能等 ,均已引入了可视化语言的概念 文中对可视化语言进行了定义和评述 ,并阐述了软件语言可视化的可能性和必然性 从语素、语义、语法、语用、编译方式等方面对软件语言可视化进行了讨论 同时陈列了当前软件语言可视化的研究热点  相似文献   

16.
为定量分析新老驾驶员在不同线形诱导信息量的草原公路弯道行车时的视觉特性,建立了5种不同层级线形诱导信息量的草原公路弯道虚拟场景,信息量水平分别为Q0、Q1、Q2、Q3、Q4,并进行了模拟驾驶试验,对驾驶员视野分区,分析不同信息量条件和驾驶熟练程度对驾驶员视觉特性的影响规律。结果表明:熟练驾驶员注视分布区域比非熟练驾驶员更远也更分散,非熟练驾驶员对近距离区域的关注程度远高于熟练驾驶员;非熟练驾驶员行车过程视觉负荷较高,对有效信息的感知和处理能力较弱,视觉搜索策略需要改善;两组驾驶员在Q2条件下的视觉强度特征表现最佳,认知和视觉搜索策略更为灵活;提出表征驾驶员眼动强度的回归模型,并分别求得两组驾驶员受信息量影响的眼动强度回归方程。  相似文献   

17.
孙瑛 《韶关学院学报》2005,26(11):133-135
现代社会处于超大量的信息传播时代,注意力成为媒介传播的关键。广告创意人必须不断寻找新的途径和新的灵感来创造不同寻常的视觉形象,在第一时间吸引受众的视线。广告的视觉创意可以通过善于突破传统羁绊,学会忘掉所学,具有敏锐的发现能力,善于出奇创新,注重变化,学会综合等途径而获得。  相似文献   

18.
视觉搜索与视觉工作记忆分别是注意理论与工作记忆模型中的研究焦点,它们之间的交互关系也是当前认知心理学中一个颇具争论性的问题:有的研究者认为视觉工作记忆影响视觉搜索,也有研究者认为两者之间存在着相互作用,还有的认为它们之间没有明显的交互影响。但总的来说,视觉搜索与视觉工作记忆存在着明显的交互作用,因为他们共享一个资源有限的视觉系统。  相似文献   

19.
The temporal dynamics in brain evoked by the scale of visual attention with the cues of Chinese characters were studied by recording event-related potentials (ERPs). With the fixed orientation of visual attention, 14 healthy young participants performed a search task in which the search array was preceded by Chinese characters cues, “大, 中, 小” (large, medium, small). 128 channels scalp ERPs were recorded to study the role of visual attention scale played in the visual spatial attention. The results showed that there was no significant difference in the ERP components evoked by the three Chinese characters cues except the inferoposterior N2 latency. The targets evoked P2, N2 amplitudes and latency have significant differences with the different cues of large, middle and small, while P1 and N1 components had no significant difference. The results suggested that the processing of scale of visual attention was mainly concerned with P2, N2 components, while the P1, N1 components were mainly related with the processing of visual orientation information.  相似文献   

20.
针对传统主动轮廓模型较低的鲁棒性能和对先验知识融合能力的不足,基于视觉注意机制的先验知识和曲线演化的理论框架,首先建立图像底层视觉显著性特征的数学模型,在此基础上提出新的曲线演化能量泛函模型,然后对该能量泛函采用变分水平集方法进行推导,得到曲线演化的偏微分方程,数值实验表明该模型相对于经典主动轮廓模型具有更强的抗噪性与分割效率.该模型的提出为进一步在主动轮廓模型中引入更高层次视觉显著性特征、得到更优越的分割模型打下了基础.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号