首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
视角无关的人体行为识别是计算机视觉领域研究的热点和难点之一.现有的视角无关的行为识别算法的识别率随着角度的改变差异很大,尤其与俯角相关的识别效果还不够理想.提出了一种基于双语动态系统包的视角无关的人体行为识别方法.首先结合兴趣点检测器和密集采样算法提取视频帧中的时空立方体并对每个时空立方体建立线性动态系统(LDS);其次对LDSs进行非线性降维聚类形成码本,并根据LDSs在码本中的分布及权重用一个动态系统包(bag of dynamical systems)来表示每个动作样本;最后同时对两个视角下的BoDS采用K-奇异值分解(K-SVD)算法得到一对可迁移字典对,然后根据这对字典对采用正交匹配追踪(OMP)算法得到两个视角下每个动作的稀疏表示.在IXMAS多视角数据库的实验结果表明了文中算法的稳定性和有效性.  相似文献   

2.
深度学习中卷积神经网络在行为识别领域有着良好的识别效果,但是由于深度学习需要较大数据集训练模型,而现今公开数据集中危险行为识别相关方向没有大量数据集。针对危险行为识别领域样本少、无法进行深度学习训练等问题,建立了危险行为识别数据集,并采用迁移学习方法对C3D网络模型进行迁移训练。结果表明,迁移学习后C3D网络模型对危险行为识别数据集平均识别率达到了83. 2%,可以有效识别危险行为动作。  相似文献   

3.
将一种跨域字典学习算法应用于人体行为识别中, 通过引入辅助域数据集, 与原始训练集(目标域)共同进行字典学习, 获得字典对, 进而得到动作类的稀疏编码, 有效扩充了训练集的类内多样性. 该算法为字典学习与训练分类相结合的学习框架, 可利用字典对学习过程中的重建误差进行分类. 实验在MATLAB仿真条件下进行, 将UCF YouTube数据集作为原始训练集, 将HMDB51数据集作为辅助域数据集, 选取两个数据集动作类别一致的7个动作, 根据提出的算法流程进行识别. 将该方法与其他两种人体行为识别算法进行对比. 结果表明, 该方法识别率显著提高, 证明了跨域字典学习算法在人体行为识别上的有效性.  相似文献   

4.
针对基于卷积神经网络(CNNs)的人体动作识别方法通常采用空域或时域局部特征的不足,提出一种融合人体动作全局时域和空间特征的双通道CNNs动作识别模型.空间通道对动作图像进行深度学习,采用多帧融合的方式提升准确率,全局时域通道对能量运动历史图(EMHI)进行深度学习,最后融合两个通道信息识别人体动作.利用现有的大型数据集进行预训练,以解决学习过程中训练样本不足问题.在UCF101数据集和该项目小样本数据集上进行实验,结果证明了该方法的有效性.  相似文献   

5.
动作识别是近年来时序数据挖掘领域的研究热点,具有广泛的应用前景。但是现阶段基于深度学习的动作识别算法需要大量的标记训练数据集,存在泛化性差、实时性差、场景受限的问题。为解决这些问题,本研究设计一种基于轻量化二维人体姿态估计的小样本动作识别算法。该算法基于YOLOv5算法构建轻量化的人体检测器HYOLOv5。基于轻量化二维姿态估计模型Lite-HRNet设计人体姿态特征描述算子,有效地去除背景对人体动作特征的干扰。为有效度量时序人体姿态特征描述算子间的相似度,本研究提出基于动态时间规整的人体姿态特征距离度量,并在此基础上设计基于类别中心选择的动作模板匹配算法。该算法通过少量的动作视频构建动作特征模板库,利用动作模板匹配算法可实现多类动作视频的精准识别。为验证算法,本研究在COCO 2017的Humans数据集上对HYOLOv5进行测试,人体检测识别精度mAP@0.5:0.95可达50.7%。基于10种动作视频数据进行测试,结果表明,本研究所提算法可有效地识别视频序列中的姿态,在每个动作仅包含4个训练数据的情况下,动作识别准确率均可达到91.8%。  相似文献   

6.
针对静态图像集中人体动作种类繁杂且识别准确率较低的问题,提出一种基于深度神经网络的人体动作识别方法;该方法采用迁移学习的思想对GoogLeNet模型进行改进,使得网络在预训练之后能够对行为个体的种类具有一定的姿势表达能力;采用逻辑分类中的逻辑回归多分类来实现动作的多分类,并通过建立动作识别模型应用系统对其进行验证;通过MATLAB2017处理平台对该模型进行测试,并得出图像的平均识别率。结果表明,本文中提出的方法在公开的图像数据集PPMI上的平均识别率相对较高,证实了构建的基于GoogLeNet人体动作识别模型应用系统对人体动作的分类是可行且有效的。  相似文献   

7.
针对人体动作识别任务中特征值选取不当导致识别率低、使用多模态数据导致训练成本高等问题,提出一种轻量级人体动作识别方法。首先使用OpenPose、PoseNet提取出人体骨架信息,使用BWT69CL传感器提取姿势信息;其次对数据进行预处理、特征融合,对人体动作进行深度学习分类识别;最后,为验证此方法的有效性,在公开数据集WISDM、UCIHAR、HASC和自建的人体动作数据集上进行实验验证,并使用改进的目标引导注意力机制(target-guided attention,TGA)–长短期记忆(long short term memory,LSTM)网络输出最终的分类结果。实验结果表明,在自建数据集下融合姿势和骨架特征达到99.87%准确率,相比于只使用姿势信息特征,识别准确率提高了约5.31个百分点;相比于只使用人体骨架特征,识别准确率提高了约1.87个百分点;在识别时间上相比于只使用姿势信息,识别时间降低了约29.73 s;相比于只使用人体骨架数据,识别时间降低了约9 s。使用该方法能及时有效地反映人体的运动意图,有助于提高人体动作和行为的识别准确率和训练效率。  相似文献   

8.
传统人体行为识别基于人工设计特征方法涉及的环节多,具有时间开销大,算法难以整体调优的缺点。以深度视频为研究对象,构建了3维卷积深度神经网络自动学习人体行为的时空特征,使用Softmax分类器进行人体行为的分类识别。实验结果表明,提出的方法能够有效提取人体行为的潜在特征,不但在MSR-Action3D数据集上能够获得与当前最好方法一致的识别效果,在UTKinect-Action3D数据集也能够获得与基准项目相当的识别效果。本方法的优势是不需要人工提取特征,特征提取和分类识别构成一个端到端的完整闭环系统,方法更加简单。同时,研究方法也验证了深度卷积神经网络模型具有良好的泛化性能,使用MSR-Action3D数据集训练的模型直接应用于UTKinect-Action3D数据集上行为的分类识别,同样获得了良好的识别效果。  相似文献   

9.
针对在高噪声环境中人体动作识别存在准确度和稳定性不高的问题,本文采用二维空间特征融合的方法,提出一种基于Kinect骨骼数据的人体动作识别算法。从人体三视图的投影来提取运动特征,可以消除人体自遮挡的影响。针对人体复杂动作,算法采用分层策略。利用Kinect获得的骨骼关节点坐标,根据人体三视图投影提取二维空间的人体关节角特征,并运用支持向量机(SVM)方法对动作进行粗分类;进一步提取二维投影平面内的关节位置矢量、角速度和加速度特征,运用隐马尔可夫模型(HMM)的方法对动作进行细分类。利用本文方法对公开数据集MSR Action 3D实验,平均识别率达93.37%,实验结果表明,该方法准确性较高,鲁棒性较强。  相似文献   

10.
人体行为识别是计算机视觉领域研究的一个热点,为了提高视频中的人体行为识别的准确率,提出了一种基于3D卷积神经网络的行为识别方法,首先构建3D CNN模型,通过三维卷积核,来提取视频中人体行为的时-空域信息,最终并在UCF-101数据集上进行训练与测试,证明了该方法具有较好的识别效果。  相似文献   

11.
再入滑翔飞行器的机动模式辨识问题是拦截方实现对其轨迹预测的关键。提出了一组与飞行器轨迹机动特点贴合的特征参数,根据构建的RGV 机动模式轨迹库,搭建了LSTM 深度学习神经网络,实现了对RGV机动模式的智能辨识。与传统模式辨识方法和其他典型特征参数的辨识网络进行对比,结果显示文中所提特征参数在LSTM 机动模式辨识网络训练中具有收敛速度快、辨识精度高和鲁棒性好的特点。  相似文献   

12.
为解决采用深度学习方法研究满文识别中训练样本匮乏的问题,提出一种使用数据增广方法扩展训练样本集的技术框架。该框架包括字体几何结构变形与图像质量变换两个模块,采用仿射变换、弹性形变等9种数据生成方法,分别模拟满文字符图像的笔画粗细变化、扭曲变形、光照不均、不同视角及背景等情况下的采集效果。在满文识别的研究中,采用该方法将每个类别的字符数据量扩展到7万个。实验表明,该方法生成的数据在一定程度上弥补了训练样本不足的问题,是解决训练样本匮乏问题的有效技术手段。  相似文献   

13.
针对合成孔径雷达(synthetic aperture radar,SAR)图像样本数据有限,且不同类别间的图像区分度不高导致识别困难的问题,提出一种应用于SAR图像识别的距离度量学习方法.该方法使用CNN网络得到图像的特征分布,利用LSTM网络加强图像间的关联性,基于余弦相似距离度量方法计算图像之间的匹配度,通过注意力机制后对结果进行分类.训练过程结合小样本学习的训练方式,采取预训练的策略进行实验.实验以公开的MSTAR数据集进行SAR图像识别,结果表明该方法准确率达到99.3%,比SVM方法提升2.5%.   相似文献   

14.
流行学习是一种分类问题的有效解决方法.采用人脸数据库作为样本集,对主要几种线性算法和LLE算法进行实验分析,尝试引入一种监督LLE算法,在针对人脸数据库的实验中发现该算法在提取非线性特征中有较好的效果.  相似文献   

15.
基于DCT和BP神经网络集成的人脸识别   总被引:1,自引:0,他引:1  
人脸识别是模式识别和图像处理领域的研究热点和难点,尽管已提出了许多方法,然而如何在变化的环境下实时、高效地识别人脸仍是一个难题.鉴于离散余弦变换(discrete cosine transform,DCT)有较高的压缩性能和快速算法以及集成神经网络良好的泛化能力,提出了基于DCT和神经网络集成的人脸识别方法.首先用DCT提取人脸特征矢量,然后构建集成BP(back propagation)神经网络对人脸进行分类识别.在ORL(olivertti research laboratory)人脸库上的仿真实验结果表明,提出的方法取得了较快的训练和识别速度、较高的识别率,因此该方法是一种快速高效的人脸识别方法.  相似文献   

16.
线性与非线性输出单元相结合的神经网络   总被引:1,自引:0,他引:1  
从神经网络的连接方式着手,扩展从隐含层到输出层的连接,提出了一种新的神经网络连接结构,在此基础上推导出了相应的学习算法.并通过对奇偶问题、非线性函数逼近问题、模式分类问题等的仿真,验证了所提出方法的有效性.实验结果表明,通过适当地调整线性输出与非线性输出的比例,所提出的算法具有训练速度快和正确识别率高的双重优点.  相似文献   

17.
针对光照、表情、噪声等因素容易造成误识别的问题,提出一种改进的SIFT特征人脸识别方法.对每个训练图像,先提取得到SIFT特征向量集合,利用每个SIFT特征向量,并选择阈值构造一个弱分类器.利用一种基于Adaboost的算法从每个训练图像的弱分类器集合中选出一部分,确定其对应的阈值和权重,然后构造出该训练图像的相似度函数.根据相似度函数可计算出目标图像与每个训练图像的相似度,从而求出目标图像与每个类的训练图像的平均相似度,则目标图像属于平均相似度最高的类.实验表明在ORL人脸数据库上则可达到98%识别率,优于现有的方法.  相似文献   

18.
针对现有的非线性降维(NLDR)算法复杂度高而不能很好地处理现实世界大规模数据集的问题,提出了基于局部约束字典学习的非线性降维(LCDL-NLDR)方法。首先通过一些潜在的标志点重构极小的内在流形,并将训练数据和未知数据自然地嵌入到内部流形中;然后利用局部约束字典学习(LCDL)算法在非线性流形中学习由标志点组成的紧密原子集;最后利用最近邻分类器完成人脸的识别。在扩展的YaleB及CMU PIE两大人脸数据库上的实验验证了所提方法的有效性及鲁棒性,通过与几种先进的字典学习算法比较表明,所提算法提高了嵌入质量,取得了更高的识别率,同时也大大地降低了NLDR算法的复杂度。  相似文献   

19.
为了解决传统方法容易受运动速率、光照情况、遮挡、复杂背景等的影响,导致识别结果鲁棒性较差的问题,通过特征提取方法研究了健美操分解动作图像自适应识别问题。通过时间能量金字塔把视频序列划分成若干段,得到结果中动作并非全为健美操动作,含大量干扰信息,通过背景消减法对进行健美操运动的人体目标进行提取,进行进一步处理,得到人体轮廓的二值图像序列,求出轮廓外界矩形宽度和高度之比,依据宽高比获取关键帧,通过拉普拉斯法求解相邻差异帧与间的光流,降低背景杂波产生的影响。针对关键帧提取特征向量,通过相似性检测对待识别健美操分解动作图像和提取特征进行匹配,设定相似性阈值,将相似性高于阈值的图像作为识别结果。结果表明:所提方法对单人健美操视频数据库的识别准确率高,仅存在一定程度的混淆;所提方法对含不同场景的复杂数据库的识别准确性和其它方法相比最高。可见所提方法受外界环境干扰小,可保证高识别精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号