首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
针对低分辨率人脸图像信息严重缺失而导致的人脸识别能力受限问题,提出了一种感知特征增强学习的低分辨率人脸识别网络.设计的整体网络包含两个通道,其中一个通道为低分辨率人脸识别子网络,顺序执行对输入的低分辨率人脸的超分辨率重构、深度特征提取与识别;另一通道为高分辨率人脸识别子网络,顺序对输入的高分辨率人脸进行深度特征提取与识...  相似文献   

2.
为充分利用时空分布信息及视觉单词间的关联信息,提出了一种新的时空非负成分表示方法(ST-NCR)用于动作识别.首先,基于视觉词袋(Bo VW)表示,利用混合高斯模型对每个视觉单词所包含的局部特征的时空位置分布进行建模,计算时空Fisher向量(STFV)来描述特征位置的时空分布;然后,利用非负矩阵分解从Bo VW表示中学习动作基元并对动作视频进行编码.为有效融合时空信息,采用基于图正则化的非负矩阵分解,并且将STFV作为图正则化项的一部分.在3个公共数据库上对该方法进行了测试,结果表明,相比于Bo VW表示和不带时空信息的非负成分表示方法,该方法能够提高动作识别率.  相似文献   

3.
基于时空特征的生猪动作识别   总被引:1,自引:0,他引:1  
针对现代化养殖业无人化、智能化的需求,以目标检测网络YOLOv2为基础,提出了一种基于深度学习提取时空特征的生猪动作识别与定位的方法.对待检测视频关键帧中的生猪空间位置信息与视频流时序动作特征进行检测,采用通道注意力模块将这2种特征进行合理且平滑的特征融合,实现了一个端到端的动作识别网络,可以直接从视频序列中预测得到关...  相似文献   

4.
无人驾驶场景中的动态物体会影响同时定位与建图(SLAM)系统的整体精度和鲁棒性,针对现有多数激光SLAM系统在动态环境下易出现里程计漂移、定位失败和建图重影问题,本文融合轻量级PointPillars目标检测网络和多目标跟踪方法,构建了一种面向动态场景的语义激光SLAM系统.该系统首先利用PointPillars网络获取潜在动态目标检测框并过滤检测框内特征点,以获取里程计初始位姿.其次基于匀速卡尔曼滤波器的多目标跟踪算法获取跟踪结果,以构建时序滑动窗口,实现鲁棒、高效的目标级数据时空关联,以去除动态物体和恢复静态目标,进一步优化里程计.最后在包含动态场景的KITTI和NUSCENES公开数据集上与主流激光SLAM方法进行对比实验,结果表明本系统在里程计和全局地图的准确性和鲁棒性方面有显著的提高,同时系统保持了实时性,可满足动态场景下自主机器人系统和智能交通应用.  相似文献   

5.
视频文字检测与多尺度定位算法   总被引:3,自引:1,他引:3  
视频文字识别(video optical character recognition, Video-OCR)的关键环节是视频文字检测.该文提出一套文字检测与定位算法,综合应用文字的梯度、纹理和时序特性,其核心技术是一种基于支持向量机(support vector machine, SVM)分类器的多尺度定位算法.用闭包矩形检测技术作为预检测限制SVM的搜索范围; 时序优化利用时序特性排除部分偶然误检.实验表明 该检测算法与同类算法相比在命中率和误检率上最多分别超出21%和57%.综合利用多种文字特性不仅加强相互限制,降低计算量,而且获得更佳检测性能.  相似文献   

6.
在问答社区专家推荐算法中,图神经网络主要利用问答社区中用户与问题的交互关系建模,其模型性能取决于交互数据的稠密度,难以对无交互信息的用户及问题进行有效表示学习.针对这一问题,提出了一个基于记忆的注意力图神经网络专家推荐方法.该方法首先设计了面向用户多维特征的联合表示子网络,然后构建了一个记忆网络,为每个问题保存用户回答...  相似文献   

7.
弱监督时序动作定位旨在于仅在视频级标签的监督下,定位未剪辑视频中的动作时间边界,并识别定位结果所对应的动作类别.由于缺少动作在时间上的标注信息,目前大多数弱监督时序动作定位方法通过聚合具有高激活值的显著动作特征来优化分类损失函数的方式训练动作定位网络,这会导致网络过度关注动作片段的关键部分,忽视了视频中部分难以分类的模糊动作片段,难以保证定位结果的完整性.基于上述问题,提出了一种具有多分支注意力机制的网络框架,分别对视频中的显著动作片段、显著背景片段和难以分类的模糊动作片段进行建模.同时,基于上述的多分支注意力权重,构建了3个相应的时域类激活序列优化动作分类损失函数,使网络能够分离视频中的显著动作特征与显著背景特征.为了使网络捕获更加完整的动作片段,基于对比学习设计了模糊动作对比损失函数,在显著特征的引导下细化视频中的模糊动作特征,使网络能够感知精确的动作时间边界,以避免完整动作的截断现象发生.所提方法在2个主流的弱监督时序动作定位数据集THUMOS-14和ActivityNet-1.2上的定位性能均超过了之前的方法.具体而言,所提方法的定位性能相比于之前的方法在上述两个数据集中分别提...  相似文献   

8.
本文综合利用颜色和形状特征进行基于内容的彩色图像检索.利用边缘方向自相关图表示图像的形状特征.对于颜色特征,计算图像颜色的局部累加直方图,同时提取分块的颜色矩弥补其不包含颜色空间分布关系的缺点.并利用Guassian模型对各特征的距离进行归一化,综合上述三个归一化距离,进行全局相似度量,且用权值调整的相关反馈方法进一步提高检索精度.与局部累加颜色直方图和局部颜色矩的方法相比较,本文提出的方法获得了更好的检索结果.  相似文献   

9.
为检测出对噪声、镜头缩放更具鲁棒性的反映人体动作特征的时空兴趣点,首先提出了一种新的时空兴趣点检测器;然后以检测出的时空兴趣点为中心,建立基于多面体模型的时空梯度描述子来进一步刻画人体动作在时空上的视觉特征;再基于分层聚类树形结构、利用词袋方法对视频动作特征建立更大且更有效的码书;最后将特征描述子与高层次的人工定义的动作属性相结合,采用隐支持向量机结合坐标下降法求解最终识别模型的局部最优解.在几种典型数据库上的实验结果表明,文中方法具有较高的人体动作识别率.  相似文献   

10.
连续手语识别相对于单个手语词识别来说,更加具有研究意义也更加具有研究难度.连续手语识别需要更关注整体语句在时间上的依赖关系,以及语句中手语词结束与开始的时序分割问题.而对此的单个识别算法的研究与优化,短时间都很难再有较大的突破.因此,我们提出一种基于算法融合的连续手语识别方法,先通过帧间差分法处理关键帧,再通过MediaPipe检测并保存关键点数据,降低数据量,并提供有效、直接的数据;再通过CNN+BLSTM算法融合模型,让CNN专注局部感知,捕捉空间特征关系;BLSTM则侧重特征序列的时序建模,突出连续手语在时间纬度上的依赖关系.最后结合CTC完成标签和语句对齐问题.该算法在CSL数据集上取得了98.4%的平均识别率.  相似文献   

11.
融合形状和运动特征的动作识别计算模型   总被引:1,自引:0,他引:1  
针对视觉系统在动作识别过程中如何利用形状与运动信息的问题,提出了一种融合形状特征和运动特征的人体动作识别方法.该方法模拟视觉皮层的背侧和腹侧通路,建立了基于双通道理论的人体动作特征计算模型.计算模型分别利用2D Gabor滤波器和3D时空滤波器模拟腹侧和背侧通路中视觉皮层简单细胞,提取动作的时空信息,通过采样、局部遍历、模板学习一系列操作分别提取动作的时空特征,并采用线性融合方法获取描述动作的特征向量,构建了采用支持向量机(SVM)进行动作分类的动作识别系统.实验结果表明:该方法的识别性能优于同类型的识别方法,取得了较好的识别效果.  相似文献   

12.
基于隶属度特征的曲线角点检测方法   总被引:3,自引:0,他引:3  
平面曲线角点检测是计算机图像处理领域的基础问题之一,笔者从曲线角点的模糊性质出发,引用模糊集合理论,提出一种包含隶属度的多元特征检测方法.首先,给出忠实于人类视觉感知的角点的两个性质,再给出包含隶属度的三组特征提取公式,且综合各特征,给出角点检测、定位的判据.最后,给出其实验结果.该方法实现简单,是目前比较新颖的方法.  相似文献   

13.
为提高中文开源数据集间属性关系识别的准确率,提出一种数据驱动的细粒度对齐方法,综合利用属性的扩展、定义域等对属性间的同义、包含、相关等关系进行统一识别.方法首先利用统计理论确定属性的数据类型,并给出类型感知的属性相似度计算方法.在此基础上,将属性关系识别建模为多分类问题,抽取有效特征对不同关系进行描述并用于随机森林模型的构建.实验结果表明,该方法中属性数据类型判别的准确率达94.6%,最终对同义、包含、相关关系识别的F1值分别为71.3%,57.3%及59.9%.相比只关注同义属性的传统方法,细粒度属性对齐方法不仅提高了同义属性识别的准确性,而且可识别出相互包含和相关的属性,证明了其在中文开源数据集上的有效性.  相似文献   

14.
基于动态自适应滤波的移动机器人障碍检测   总被引:1,自引:0,他引:1  
设计并实现了一个移动机器人感知系统,将二维激光雷达固定在一个精密电控转台上,通过转台水平与俯仰角度的转动感知环境.为了检测障碍,依据该系统的环境感知信息建立了高度图.针对系统误差与传感器噪声干扰提出一种动态自适应滤波器,通过激光测距数据时空关联性的分析进行实时动态地滤波.此外,采用Gauss分布的平滑滤波器减少扫描间隙.在导航过程中,通过对高度图进行地形平坦性分析判断可行区域与障碍区域以实现避障.实验表明基于动态自适应滤波的障碍检测方法是有效的,可以为非结构化环境下移动机器人导航中路径规划、自定位提供支持.  相似文献   

15.
点云语义分割技术是点云数据处理、三维场景理解与分析的有效手段之一。针对点云场景中局部形态各异,导致网络模型识别特征困难的问题,提出了邻域分布关系学习和混合尺度融合的方法,来增强局部感知能力。在卷积算子思想的基础上,根据邻域内所有点在三个坐标轴方向上的联合分布,学习其在高维特征层面的关系,从而捕获局部的整体相关性。此外,将包含小范围底层特征和大范围深层特征的邻域进行整体融合,有效保留不同层级的特征,并能够辅助网络修正相似或错误特征。在场景分割数据集S3DIS、ScanNet上进行实验验证,结果表明该方法在总体精度和类均精度的评价指标上均有提升,证明了其有效性。  相似文献   

16.
以高校教师科研论文合作关系为研究对象,并以教师合作发表论文数据为例,构建了科研论文合作网络,利用Pajek和Ucinet软件对论文合作关系进行了分析,并以社会网络分析方法为基础对网络的整体特性、子网特征及结点的中心性进行了研究。  相似文献   

17.
针对现有的大部分细粒度图像分类算法都忽略了局部定位和局部特征学习是相互关联的问题,提出了一种基于集成迁移学习的细粒度图像分类算法。该算法的分类网络由区域检测分类和多尺度特征组合组成。区域检测分类网络通过类别激活映射(class activation mapping,CAM)方法获得局部区域,以相互强化学习的方式,从定位的局部区域中学习图像的细微特征,组合各局部区域特征作为最终的特征表示进行分类。该细粒度图像分类网络在训练过程中结合提出的集成迁移学习方法,基于迁移学习,通过随机加权平均方法集成局部训练模型,从而获得更好的最终分类模型。使用该算法在数据集CUB-200-2011和Stanford Cars上进行实验,结果表明,与原有大部分算法对比,该算法具有更优的细粒度分类结果。  相似文献   

18.
结合不同类型的汉字特征——尺度不变特征变换(SIFT)和轮廓信息,提出一种基于星型图的汉字镜像对称检测方法.该方法利用基础对称元素构造一个加强关系有向图来描述不同对称元素之间的加强关系,从而将检测汉字的显著对称轴问题转化为寻找具有局部最大权重的星型子图问题.实验结果表明,与现有方法相比,所提方法在汉字数据集上具有更好的检测效果.  相似文献   

19.
基于深度学习的方法在去模糊领域已经取得了很大的进展,但目前的CNN结构通常会对特征图进行下采样,导致图像特征在网络学习过程丢失.针对这些问题,本文设计了一种基于高分辨率特征保持的图像去模糊网络,与现有的串行连接由高-低分辨率图像特征图不同,所设计网络并行连接由高至低各分辨率特征子网络,而无需经过由低分辨率到高分辨率的重...  相似文献   

20.
针对目前已有的虹膜检测与定位算法的局限性, 设计了一组具有局部互联结构的神经网络, 结合AdaBoost算法用于虹膜的检测与定位. 算法主要有以下特征: 根据虹膜图像的特点设计了一组具有不同感受野和不同复杂程度的局部互联神经网络虹膜分类器; 应用AdaBoost算法整合神经网络分类器, 产生一个具有很强虹膜检测能力的总分类器; 采用级联结构提高系统的检测速度. 实验结果表明, 该方法具有极高的检测精度与速度, 有效地解决了包含大量脸部区域的虹膜检测与定位问题, 以及以往方法很难解决的白内障患者的虹膜检测和定位问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号