In-cabin Driver Monitoring Systems (DMS) must recognize distraction- and drowsiness-related behaviors with low latency under strict constraints on compute, power, and cost. We present a single-camera in-cabin driver behavior recognition system designed for deployment on two low-cost edge platforms: Raspberry Pi 5 (CPU-only) and Google Coral Edge TPU. The proposed pipeline combines (i) a compact per-frame vision model, (ii) a confounder-aware label design to reduce visually similar false positives, and (iii) a temporal decision head that triggers alerts only when predictions are both confident and sustained. The system covers 17 behavior classes, including multiple phone-use modes, eating/drinking, smoking, reaching behind, gaze/attention shifts, passenger interaction, grooming, control-panel interaction, yawning, and eyes-closed sleep. Training and evaluation use licensed datasets spanning diverse drivers, vehicles, and lighting conditions (details in Section 6), and we further validate runtime behavior in real in-vehicle tests. The optimized deployments achieve about 16 FPS on Raspberry Pi 5 with INT8 inference (per-frame latency under 60 ms) and about 25 FPS on Coral Edge TPU, enabling real-time monitoring and stable alert generation on inexpensive hardware. Finally, we discuss how reliable in-cabin human-state perception can serve as an upstream input for human-centered vehicle intelligence, including emerging agentic vehicle concepts.


翻译:车内驾驶员监控系统(DMS)必须在计算能力、功耗和成本严格受限的条件下,以低延迟识别与分心和困倦相关的行为。我们提出了一种单摄像头车内驾驶员行为识别系统,专为在两种低成本边缘平台上部署而设计:Raspberry Pi 5(仅CPU)和Google Coral Edge TPU。所提出的流程结合了(i)一个紧凑的逐帧视觉模型,(ii)一个用于减少视觉相似误报的混淆因子感知标签设计,以及(iii)一个仅在预测结果既高置信又持续时才触发警报的时序决策头。该系统涵盖17种行为类别,包括多种手机使用模式、饮食、吸烟、伸手至身后、视线/注意力转移、与乘客互动、整理仪表、与控制面板互动、打哈欠以及闭眼睡眠。训练和评估使用了涵盖不同驾驶员、车辆和光照条件的授权数据集(详见第6节),我们还在真实车载测试中进一步验证了运行时行为。优化后的部署在Raspberry Pi 5上通过INT8推理实现了约16 FPS(每帧延迟低于60毫秒),在Coral Edge TPU上实现了约25 FPS,从而能够在廉价硬件上实现实时监控和稳定的警报生成。最后,我们讨论了可靠的车内人员状态感知如何作为以人为本的车辆智能(包括新兴的具身车辆概念)的上游输入。

0
下载
关闭预览

相关内容

《用于代码弱点识别的 LLVM 中间表示》CMU
专知会员服务
14+阅读 · 2022年12月12日
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
【NeurIPS2019】图变换网络:Graph Transformer Network
Focal Loss for Dense Object Detection
统计学习与视觉计算组
12+阅读 · 2018年3月15日
深度学习人脸识别系统DFace
深度学习
17+阅读 · 2018年2月14日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
VIP会员
相关资讯
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
【NeurIPS2019】图变换网络:Graph Transformer Network
Focal Loss for Dense Object Detection
统计学习与视觉计算组
12+阅读 · 2018年3月15日
深度学习人脸识别系统DFace
深度学习
17+阅读 · 2018年2月14日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员