排序方式: 共有31条查询结果,搜索用时 15 毫秒
1.
情绪识别作为计算机视觉的一项基本课题已经取得很大进展,然而在无约束自然场景中的情绪识别仍具挑战性.现有方法主要是利用人脸、姿态以及场景信息识别情绪,但是忽略了人物个体在场景中的不确定性,以及不能很好地挖掘场景中的情绪线索.针对现有研究存在的问题,提出了基于人物与场景线索的双分支网络结构,两个分支独立学习,通过早期融合得到情绪分类结果.对于人物在场景中的不确定性,引入身体注意力机制预判人物情绪置信度进而获得人体的特征表示,场景中引入空间注意力机制和特征金字塔以便充分获得场景中不同粒度的情绪线索.实验结果表明,此方法有效融合人物与场景信息,在EMOTIC数据集下能够明显提高情绪识别率. 相似文献
2.
融合场景及交互性特征的多人行为识别 总被引:1,自引:0,他引:1
人类的行为复杂多样,场景、外观、位置等信息均与行为息息相关.本文针对如何高效地综合利用这些信息的问题,提出了融合场景及交互性特征的多人行为识别方法,使用双通道的方式分别提取个体外观特征与场景特征.对于个体通道,采用注意力机制模块来关注与行为相关度更大的区域,并将提取的个体外观特征结合位置特征输入图卷积网络进行关系推理.其中,图卷积网络采用了余弦相似度的方法度量个体特征之间的相关性,并结合个体之间的位置特征进行关系推理;对于场景通道,使用在place365数据集上预训练的ResNet 50提取场景特征.最后,本文将个体以及场景通道所得的特征进行加权融合,得到群组以及所有个体的行为识别结果.在Collective Activity Dataset(CAD)数据集上的实验表明,该方法能提高行为识别的准确率,群组行为以及个体行为的准确率分别达到了92.29%与78.19%. 相似文献
3.
针对小目标物体检测精度差的问题,同时不以牺牲速度为代价,本文提出了一种基于全局注意力的多级特征融合目标检测算法。算法首先由卷积神经网络生成多尺度的特征图,然后采用多级特征融合的方法,将浅层和深层特征图的语义信息相结合,提高特征图的表达能力,接着引入全局注意力模块,对特征图上下文信息进行建模,并捕获通道之间的依赖关系来选择性地增强重要的通道特征。此外,在多任务损失函数的基础上增加一项额外的惩罚项来平衡正负样本。最后经过分类回归、迭代训练和过滤重复边框得到最终检测模型。对所提算法在PASCAL VOC数据集上进行了训练和测试,结果表明该算法能有效地提升小目标物体检测效果,并较好地平衡了检测精度与速度之间的关系。 相似文献
4.
针对统计特征函数和传统的球面调和函数不能有效刻画岩心三维模型形态特征的问题,提出了一种岩心球面调和函数.首先将三维岩心分解成同心球模型,并根据同心球的不同半径得到一系列的球面函数.然后对生成的球面函数进行调和分析获得形态特征描述子.最后通过相似性判定函数比较形态特征描述子获得不同岩心三维模型的形态相似性.利用多组砂岩岩心样本进行了比较实验,结果表明新算法能够有效描述岩心三维模型的形态特征,并且比统计特征函数和传统的球面调和函数具有更为准确的刻画能力. 相似文献
5.
JPEG压缩编码在DM642平台上的实现及优化 总被引:2,自引:2,他引:0
结合TMS320DM642处理器VP口视频采集原理和JPEG压缩编码原理,研究了在TMS320DM642处理器平台上实现图像采集和JPEG压缩编码的具体方法.以此为基础,深入探索了JPEG压缩编码在TMS320DM642处理器平台上的优化,并提出了基于DCT系数低通滤波原理的JPEG压缩编码优化算法,最后对优化结果做出了数值分析.分析结果表明,该算法不仅保证了图像的质量,而且提高了JPEG压缩编码的速度和效率. 相似文献
6.
PTZ视频监控的大场景形成方法研究 总被引:1,自引:0,他引:1
针对PTZ摄像机跟踪监控系统,提出一种基于关键帧和Speeded Up Robust Features(SURF)特征的图像拼接方法,以构建大的监控场景.利用局部梯度极值平均法对监控视频各帧的清晰度进行评价,剔除模糊帧,选择若干清晰帧作为关键帧进行拼接,以提高大场景的形成速度和准确度.对于图像拼接,采用效果近似于Sca... 相似文献
7.
介绍了视频芯片CX2388x的主要性能特点,分析了应用DriverStudio编写WDM驱动程序的优势,采用DriverStudio+VisualC++的开发方式实现了基于CX2388x的PCI图像采集卡的驱动。 相似文献
8.
情绪识别指在使计算机拥有能够感知和分析人类情绪和意图的能力,从而在娱乐、教育、医疗和公共安全等领域发挥作用.与直观的面部表情相比,身体姿态在情绪识别方面的作用总是被低估.针对公共空间个体人脸分辨率较低、表情识别精度不高的问题,提出了融合面部表情和身体姿态的情绪识别方法.首先,对视频数据进行预处理获得表情通道和姿态通道的输入序列;然后,使用深度学习的方法分别提取表情和姿态的情绪特征;最后,在决策层进行融合和分类.构建了基于视频的公共空间个体情绪数据集(SCU-FABE),在此基础上,结合姿态情绪识别数据增强,实现了公共空间个体情绪的有效识别.实验结果表明,表情和姿态情绪识别取得了94.698%和88.024%的平均识别率;融合情绪识别平均识别率为95.766%,有效融合了面部表情和身体姿态表达的情绪信息,在真实场景视频数据中具有良好的泛化能力和适用性. 相似文献
9.
对于基于高光谱图像的植被分类,利用三维卷积神经网络和空谱结合可以取得良好的效果。但存在计算代价大、参数过多容易过拟合等问题。基于此,设计了一种三维卷积与二维卷积相结合的深度网络,通过数据分块的思想减小了计算量;并提出了一种融合植被指数的特征提取方法,改善了现阶段因高光谱图像样本数量少、光谱层间信息相关度高,造成的容易过拟合的问题。在植物园数据集、IP数据集和PU数据集上的实验结果表明该算法以较低的计算复杂度取得了出色的分类效果,具有较好的应用价值。 相似文献
10.
随着5G通信和物联网大数据技术的高速发展,传统的云计算模式已经越来越跟不上数据的增长速度了,边缘计算作为一种新的计算模式,表现出了很强的处理大数据和高速计算的能力.本文在“智能交通仿真系统”课题中,提出了一种适合于视频图像处理的边缘计算框架,并对传统的动目标跟踪算法进行了两点改进:(1) 采用树莓派作为视频前端处理器,具有体积小,成本低,计算能力强的特点,适合边缘计算;(2) 针对跟踪阶段需要采集大量样本,计算量大的缺点,采用了一种较小步长作为滑动窗的分步式图像采样方法对原压缩跟踪算法进行改进,从而减少了计算量.计算机仿真实验的结果证实了该算法在基本不影响跟踪精度的情况下提高了运算速度. 相似文献