In this paper, we present a method to detect the hand-object interaction from an egocentric perspective. In contrast to massive data-driven discriminator based method like \cite{Shan20}, we propose a novel workflow that utilises the cues of hand and object. Specifically, we train networks predicting hand pose, hand mask and in-hand object mask to jointly predict the hand-object interaction status. We compare our method with the most recent work from Shan et al. \cite{Shan20} on selected images from EPIC-KITCHENS \cite{damen2018scaling} dataset and achieve $89\%$ accuracy on HOI (hand-object interaction) detection which is comparative to Shan's ($92\%$). However, for real-time performance, with the same machine, our method can run over $\textbf{30}$ FPS which is much efficient than Shan's ($\textbf{1}\sim\textbf{2}$ FPS). Furthermore, with our approach, we are able to segment script-less activities from where we extract the frames with the HOI status detection. We achieve $\textbf{68.2\%}$ and $\textbf{82.8\%}$ F1 score on GTEA \cite{fathi2011learning} and the UTGrasp \cite{cai2015scalable} dataset respectively which are all comparative to the SOTA methods.


翻译:在本文中, 我们从自我中心角度展示了一种检测手动物体互动的方法。 与像\ cite{ shan20} 这样的大规模数据驱动的基于歧视者的方法相比, 我们提出了一种使用手和物体提示的新型工作流程。 具体地说, 我们训练网络, 预测手姿势、 手蒙面和手持物体遮罩, 以共同预测手动物体互动状态。 我们比较了我们的方法和Shan et al.\ cite{ shan20} 在EPIC- Kitchennes\ cite{damen2018scating} 数据集中的最新工作, 并实现了 HOI( 手动弹点互动) 检测的89 $ 。 然而, 对于实时性能, 我们的方法可以超过$\ textb{ 30} FPS, 这比 Shan ($\ textbff{ 1\\\\\\ cal\ textb} FPPS $。 此外, 我们可以用SO2\\\ recreal Stateal a rodustrateal rodustrate) 活动段段段, 我们用SOI2\\\\\\\\ dex stateal ex ex stateal a grogres) axxxxxxxxx 。

0
下载
关闭预览

相关内容

IFIP TC13 Conference on Human-Computer Interaction是人机交互领域的研究者和实践者展示其工作的重要平台。多年来,这些会议吸引了来自几个国家和文化的研究人员。官网链接:http://interact2019.org/
【图与几何深度学习】Graph and geometric deep learning,49页ppt
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
50+阅读 · 2020年2月26日
无人机视觉挑战赛 | ICCV 2019 Workshop—VisDrone2019
PaperWeekly
7+阅读 · 2019年5月5日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
carla 体验效果 及代码
CreateAMind
7+阅读 · 2018年2月3日
【推荐】(TensorFlow)SSD实时手部检测与追踪(附代码)
机器学习研究会
11+阅读 · 2017年12月5日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
Scale-Aware Trident Networks for Object Detection
Arxiv
4+阅读 · 2019年1月7日
Joint Monocular 3D Vehicle Detection and Tracking
Arxiv
8+阅读 · 2018年12月2日
VIP会员
相关VIP内容
【图与几何深度学习】Graph and geometric deep learning,49页ppt
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
50+阅读 · 2020年2月26日
Top
微信扫码咨询专知VIP会员