Discovery of Latent 3D Keypoints via End-to-end Geometric Reasoning
这篇论文提出了KeypointNet,这是一种端到端的几何推理框架,可以学习特殊类型的最优3D关键点表示。给定一张图像,KeypointNet可以提取出最优3D关键点,以进行下游任务处理。我们在3D动作估计上展示了这一框架,模型可以通过目标物体的角度发现几何和语义上连贯的关键点。
地址:https://arxiv.org/abs/1807.03146
PFDet:2nd Place Solution to Open Images Challenge 2018 Object Detection Track
我们PFDet团队提出了一个大型目标检测系统,该系统可以用512个GPU训练大型数据集,处理稀疏验证的类别。利用我们的方法,在谷歌AI的图像目标检测追踪比赛上获得了第二名。
地址:https://arxiv.org/abs/1809.00778
Keep it stupid simple
深度强化学习现在能达到甚至超越人类水平,但如果对环境做出微小改动,网络就会无法适应。但人类可以很快地进行适应。我们假设这是由于人类能进行启发式学习,并且能对环境进行思考。我们提出了一种能分层进行强化学习的模型,结合了以上要素和策略网络。
地址:https://arxiv.org/abs/1809.03406