基于盒注意力机制和Transformer的人脸微表情识别方法 |
| |
引用本文: | 唐梦瑶,黄江涛.基于盒注意力机制和Transformer的人脸微表情识别方法[J].西南师范大学学报(自然科学版),2023(9):57-67. |
| |
作者姓名: | 唐梦瑶 黄江涛 |
| |
作者单位: | 1. 南宁师范大学计算机与信息工程学院;2. 广西人机交互与智能决策重点实验室 |
| |
基金项目: | 国家自然科学基金项目(62067007);;广西重点研发计划项目(桂科AB21076009); |
| |
摘 要: | 微表情是一种细微的能够体现人真实心理活动的面部运动,通常与真实情感直接相关,应用前景广阔。但由于微表情持续时间短暂、表情幅度低和特征难以提取等特点,因此其识别准确率较低。针对该问题,提出了基于盒注意力机制和Transformer的人脸微表情识别模型(vision transformer based on box-attention, ViT-Box)。该模型首先对人脸面部进行特征提取,利用盒注意力机制获得自适应的面部微表情关键区域:左眉眼、右眉眼和嘴巴;然后对非关键区域进行掩码遮盖,避免微表情无关信息干扰;最后基于Vision Transformer网络实现人脸微表情识别。ViT-Box模型在微-宏表情仓库(MMEW)数据集上取得了98.68%的平均准确率,实验结果表明该模型在微表情识别上能够获得优秀的识别效果。同时通过消融实验验证了ViT-Box模型的有效性。
|
关 键 词: | 微表情识别 盒注意力机制 目标检测 视觉Transformer 关键区域提取 人脸掩码 YOLOv5模型 多层感知机 |
|