基于轻量型空间特征编码网络的驾驶人注视区域估计算法 |
| |
作者姓名: | 张名芳 李桂林 吴初娜 王力 佟良昊 |
| |
作者单位: | 1. 北方工业大学 城市道路交通智能控制技术北京市重点实验室, 北京 100144;2. 交通运输部 公路科学研究院, 运输车辆运行安全技术交通运输行业重点实验室, 北京 100088 |
| |
基金项目: | 国家自然科学基金资助项目(51905007);北京市教育委员会科学研究计划项目(KM202210009013) |
| |
摘 要: | 实时监测驾驶人注视区有助于人机共驾汽车理解并判断驾驶人的意图。针对车载环境下算法精度和实时性难以平衡的问题,提出了一种基于轻量型空间特征编码网络(lightweight spatial feature encoding network,LSFENet)的驾驶人注视区估计算法。通过人脸对齐和眼镜移除步骤对采集的驾驶人上半身图像序列进行预处理,得到左右眼图像和人脸关键点坐标;在MobileNetV2的基础上构建基于GCSbottleneck模块的LSFENet特征提取网络,集成注意力机制模块增强关键特征权重,生成左右两眼特征;利用Kronecker积融合眼部与人脸关键点特征,将连续帧图像融合后的特征输入循环神经网络中,得到该图像序列的注视区域估计结果;利用公开数据集和自制数据集对新算法进行测试。实验结果表明: LSFENet算法的注视区估计准确率可达97.08%,每秒能检测约103帧图像,满足车载环境下运算效率和精度需求;LSFENet算法对注视区1、2、3、4、9的估计准确率均在85%以上,且对不同光照条件和眼镜遮挡情况均具有较强的适应能力。研究结果对驾驶人视觉分心状态识别具有重要意义。
|
关 键 词: | 注视区域估计 轻量型空间特征编码网络 注意力机制 特征提取 Kronecker积 循环神经网络 |
|
| 点击此处可从《清华大学学报(自然科学版)》浏览原始摘要信息 |
|
点击此处可从《清华大学学报(自然科学版)》下载全文 |
|