动态 | 阿里巴巴 iDST 再度刷新世界纪录，这次是行人检测与识别 - 专知

会员服务 ·

0

动态 | 阿里巴巴 iDST 再度刷新世界纪录，这次是行人检测与识别

2018 年 1 月 9 日 AI科技评论 奕欣

AI 科技评论消息，1 月 8 日，全球权威机器视觉算法排行榜 KITTI，阿里巴巴 iDST夺得行人检测单项冠军。与此同时，在知名的行人再识别数据集 Market1501 中，iDST 的首位命中率也提升至 96.17%，位居世界第一。

iDST获得KITTI行人检测项目冠军

iDST在KITTI行人检测项目的数据图示

KITTI 算法评测平台由德国卡尔斯鲁厄理工学院和芝加哥丰田技术研究所联合建立，是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集，用于评测目标（机动车、非机动车、行人等）检测、目标跟踪、路面分割等计算机视觉技术在车载环境下的性能。

Market1501 数据集的图像在清华大学的一个超市门口进行采集，由 5 个高清摄像头与 1 个低像素摄像头进行拍摄。目前该数据集包括 1501 个个体，涵盖 19732 张 gallery 图片和 12936 张训练图像组成。所有的标注框由 DPM 检测器生成。

实际上在今年 5 月，阿里 iDST 就已经将车辆检测的准确率提升至 90.46%，长踞榜单第一名。而在同一难度级别的最新数据，阿里 iDST 如今已经刷新至 90.55%。

据 AI 科技评论了解，车辆检测背后的技术基于区域融合决策和上下文相关的多任务深度神经网络，用于复杂场景下的车辆检测任务，重点解决其中多视角，多姿态以及车辆遮挡等问题。而在网络结构设计上，利用反卷积操作提高了小目标的召回率，同时拼接了多层特征以融合低层的局部信息和高层的语义信息，提高了边框定位的准确率。在训练过程中，还借鉴了 GAN（生成对抗网络）中的对抗训练模式。团队在计算机视觉国际顶级期刊和会议 TIP、ACM MM 等已发表多篇论文，分享了他们的研究成果。

行人检测技术示意

行人再识别技术示意

行人的识别与检测与车辆检测虽然同为计算机视觉的研究内容，但两者各自的难点与挑战又有些不同。行人检测要求机器能够从图像或者视频中判断是否有行人，行人在哪里；行人再识别则要求机器能够识别出特定人员在不同摄像头下出现的所有图像。

阿里巴巴 iDST 副院长、IEEE Fellow 华先胜表示，目前大部分摄像头所拍摄的图像看不清人脸，需要通过行人的整体和局部特征进行识别。但在实际情况中，包括遮挡、光照、拍摄角度、拍摄距离、人物姿态等因素的干扰，还有摄像头设备的不同，都会给行人的识别与检测带来困难。

据介绍，阿里巴巴 iDST 团队在行人检测技术方面，提出了基于目标尺寸分级的级联网络，并充分发挥感兴趣区域的上下文信息，提升网络特征提取的能力，以解决行人检测问题中存在的目标尺寸浮动大、遮挡、形变且定位不准等问题；与此同时，在目标定位方面采用交叉熵正则约束来优化边框定位准确度。

而在行人再识别方面，团队不仅利用最新的深度学习技术提取行人的全局特征，还提出了超分辨率模块和深度注意力网络来获得头部、躯干、四肢、携带物等局部细节特征，并提出了融合粗粒度全局特征和细粒度局部特征的新方法，进一步提高了跨摄像头场景下行人表征的一致性和行人再识别的准确性。

行人检测与行人识别这两项技术有着丰富的应用场景，包括景区商场的人流预测、人群个性化分析、行人交通安全、无人驾驶、寻找丢失老人儿童等应用等等。目前上述技术已经全部集成到阿里云 ET 城市大脑当中，并已落地。

华先胜表示，「正如 60 年代的登月计划带来了通讯技术、生物工程技术大爆发一样，城市大脑已经成为世界顶尖的科技创新的平台，前所未有的难题倒逼科学家们创造前所未有的技术」。

据 AI 科技评论了解，阿里云 ET 城市大脑已经在杭州、苏州、衢州、乌镇等地落地。借助机器视觉算法，杭州城市大脑可以做到准确侦测、发现交通事故，日均事件报警 500 次以上，准确率达 92%。

封面图 via 云栖社区

————— 新人福利 —————

关注AI 科技评论，回复 1 获取

【数百 G 神经网络 / AI / 大数据资源，教程，论文】

————— AI 科技评论招人了 —————

AI 科技评论期待你的加入，和我们一起见证未来！

现诚招学术编辑、学术兼职、学术外翻

详情请点击招聘启事

————— 给爱学习的你的福利 —————

上海交通大学博士讲师团队

从算法到实战应用，涵盖CV领域主要知识点；

手把手项目演示

全程提供代码

深度剖析CV研究体系

轻松实战深度学习应用领域！

点击阅读原文详细了解

▼▼▼

————————————————————

登录查看更多

5

相关内容

行人检测

行人检测( Pedestrian Detection)是利用计算机视觉技术判断图像或者视频序列中是否存在行人并给予精确定位。该技术可与行人跟踪，行人重识别等技术结合，应用于人工智能系统、车辆辅助驾驶系统、智能机器人、智能视频监控、人体行为分析、智能交通等领域。

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

专知会员服务

44+阅读 · 2020年6月30日

最新《自然场景中文本检测与识别》综述论文，26页pdf

最新《自然场景中文本检测与识别》综述论文，26页pdf

专知会员服务

70+阅读 · 2020年6月10日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知会员服务

39+阅读 · 2020年4月6日

AAAI 2020最佳论文公布，华盛顿大学、AllenAI、NTU、清华、港大等斩获

AAAI 2020最佳论文公布，华盛顿大学、AllenAI、NTU、清华、港大等斩获

专知会员服务

51+阅读 · 2020年2月8日

天津大学等发布最新「无人机视觉检测和跟踪」综述论文：过去、现在和未来

天津大学等发布最新「无人机视觉检测和跟踪」综述论文：过去、现在和未来

专知会员服务

63+阅读 · 2020年1月21日

【德勤】中国人工智能产业白皮书，68页pdf

【德勤】中国人工智能产业白皮书，68页pdf

专知会员服务

310+阅读 · 2019年12月23日

【CAAI 2019】基于知识智能的机器人技能学习，清华大学|孙富春

【CAAI 2019】基于知识智能的机器人技能学习，清华大学|孙富春

专知会员服务

43+阅读 · 2019年12月1日

【元学习 | 论文】CoRL19，元世界:多任务和元强化学习的基准和评估，伯克利分校，Google

【元学习 | 论文】CoRL19，元世界:多任务和元强化学习的基准和评估，伯克利分校，Google

专知会员服务

27+阅读 · 2019年11月21日

【CCL 2019】句法分析前沿动态综述，上海科技大学屠可伟博士

【CCL 2019】句法分析前沿动态综述，上海科技大学屠可伟博士

专知会员服务

26+阅读 · 2019年11月12日

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

专知会员服务

49+阅读 · 2019年11月8日

重磅！商汤开源目标跟踪最强算法SiamRPN系列

重磅！商汤开源目标跟踪最强算法SiamRPN系列

AI前线

13+阅读 · 2019年5月24日

动态 | 微软刷新CoQA对话问答挑战赛纪录，模型性能达到人类同等水平

动态 | 微软刷新CoQA对话问答挑战赛纪录，模型性能达到人类同等水平

AI研习社

4+阅读 · 2019年5月8日

苗米科技鲁超：基于WiFi的姿态识别，打破视频识别盲区 | 镁客请讲

苗米科技鲁超：基于WiFi的姿态识别，打破视频识别盲区 | 镁客请讲

镁客网

5+阅读 · 2019年2月26日

【深度】行人检测算法

【深度】行人检测算法

GAN生成式对抗网络

29+阅读 · 2018年6月3日

腾讯AI Lab刷新人脸检测与识别两大测评国际记录，技术日调用超六亿

腾讯AI Lab刷新人脸检测与识别两大测评国际记录，技术日调用超六亿

人工智能学家

3+阅读 · 2017年12月21日

腾讯AI Lab两大算法刷新人脸识别与检测纪录，秉承「基础研究+落地应用」之路

腾讯AI Lab两大算法刷新人脸识别与检测纪录，秉承「基础研究+落地应用」之路

AI科技评论

7+阅读 · 2017年12月20日

行人再识别中的迁移学习

行人再识别中的迁移学习

计算机视觉战队

11+阅读 · 2017年12月20日

人脸检测与识别总结

人脸检测与识别总结

计算机视觉战队

21+阅读 · 2017年11月29日

【首次超越人类】旷视行人再识别（ReID）突破，人脸识别后创新纪录

【首次超越人类】旷视行人再识别（ReID）突破，人脸识别后创新纪录

新智元

5+阅读 · 2017年11月24日

【消息】自动化所获计算机视觉大会ICCV2017场景解析竞赛冠军

【消息】自动化所获计算机视觉大会ICCV2017场景解析竞赛冠军

中国科学院自动化研究所

5+阅读 · 2017年11月6日

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

Combination of Multiple Global Descriptors for Image Retrieval

Combination of Multiple Global Descriptors for Image Retrieval

Arxiv

3+阅读 · 2019年4月18日

Object Detection in Videos by High Quality Object Linking

Arxiv

4+阅读 · 2019年4月8日

UPSNet: A Unified Panoptic Segmentation Network

UPSNet: A Unified Panoptic Segmentation Network

Arxiv

4+阅读 · 2019年1月12日

SFA: Small Faces Attention Face Detector

Arxiv

4+阅读 · 2018年12月20日

Re-Identification with Consistent Attentive Siamese Networks

Re-Identification with Consistent Attentive Siamese Networks

Arxiv

8+阅读 · 2018年11月23日

Pooling Pyramid Network for Object Detection

Arxiv

6+阅读 · 2018年7月9日

Object Tracking in Satellite Videos Based on a Multi-Frame Optical Flow Tracker

Arxiv

5+阅读 · 2018年4月25日

Multi-Level Factorisation Net for Person Re-Identification

Arxiv

4+阅读 · 2018年4月17日

AlignedReID: Surpassing Human-Level Performance in Person Re-Identification

Arxiv

7+阅读 · 2018年1月31日

VIP会员

相关主题

行人再识别

机器视觉算法

芝加哥丰田技术研究所

相关VIP内容

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

【CVPR2020】通过获取高质量的关键点对来提升目标检测性能

专知会员服务

44+阅读 · 2020年6月30日

最新《自然场景中文本检测与识别》综述论文，26页pdf

最新《自然场景中文本检测与识别》综述论文，26页pdf

专知会员服务

70+阅读 · 2020年6月10日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知会员服务

39+阅读 · 2020年4月6日

AAAI 2020最佳论文公布，华盛顿大学、AllenAI、NTU、清华、港大等斩获

AAAI 2020最佳论文公布，华盛顿大学、AllenAI、NTU、清华、港大等斩获

专知会员服务

51+阅读 · 2020年2月8日

天津大学等发布最新「无人机视觉检测和跟踪」综述论文：过去、现在和未来

天津大学等发布最新「无人机视觉检测和跟踪」综述论文：过去、现在和未来

专知会员服务

63+阅读 · 2020年1月21日

【德勤】中国人工智能产业白皮书，68页pdf

【德勤】中国人工智能产业白皮书，68页pdf

专知会员服务

310+阅读 · 2019年12月23日

【CAAI 2019】基于知识智能的机器人技能学习，清华大学|孙富春

【CAAI 2019】基于知识智能的机器人技能学习，清华大学|孙富春

专知会员服务

43+阅读 · 2019年12月1日

【元学习 | 论文】CoRL19，元世界:多任务和元强化学习的基准和评估，伯克利分校，Google

【元学习 | 论文】CoRL19，元世界:多任务和元强化学习的基准和评估，伯克利分校，Google

专知会员服务

27+阅读 · 2019年11月21日

【CCL 2019】句法分析前沿动态综述，上海科技大学屠可伟博士

【CCL 2019】句法分析前沿动态综述，上海科技大学屠可伟博士

专知会员服务

26+阅读 · 2019年11月12日

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

专知会员服务

49+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争中的无人系统：新的战争方式与新兴趋势——来自前线的印象》报告

《海上自主水面船舶远程操作中心：安全可持续运行的多维度分析》

多模态大语言模型下游调优中“保持自我”的重要性

隐身自主无人水下航行器技术如何变革水下作战并重塑海军竞争

相关资讯

重磅！商汤开源目标跟踪最强算法SiamRPN系列

重磅！商汤开源目标跟踪最强算法SiamRPN系列

AI前线

13+阅读 · 2019年5月24日

动态 | 微软刷新CoQA对话问答挑战赛纪录，模型性能达到人类同等水平

动态 | 微软刷新CoQA对话问答挑战赛纪录，模型性能达到人类同等水平

AI研习社

4+阅读 · 2019年5月8日

苗米科技鲁超：基于WiFi的姿态识别，打破视频识别盲区 | 镁客请讲

苗米科技鲁超：基于WiFi的姿态识别，打破视频识别盲区 | 镁客请讲

镁客网

5+阅读 · 2019年2月26日

【深度】行人检测算法

【深度】行人检测算法

GAN生成式对抗网络

29+阅读 · 2018年6月3日

腾讯AI Lab刷新人脸检测与识别两大测评国际记录，技术日调用超六亿

腾讯AI Lab刷新人脸检测与识别两大测评国际记录，技术日调用超六亿

人工智能学家

3+阅读 · 2017年12月21日

腾讯AI Lab两大算法刷新人脸识别与检测纪录，秉承「基础研究+落地应用」之路

腾讯AI Lab两大算法刷新人脸识别与检测纪录，秉承「基础研究+落地应用」之路

AI科技评论

7+阅读 · 2017年12月20日

行人再识别中的迁移学习

行人再识别中的迁移学习

计算机视觉战队

11+阅读 · 2017年12月20日

人脸检测与识别总结

人脸检测与识别总结

计算机视觉战队

21+阅读 · 2017年11月29日

【首次超越人类】旷视行人再识别（ReID）突破，人脸识别后创新纪录

【首次超越人类】旷视行人再识别（ReID）突破，人脸识别后创新纪录

新智元

5+阅读 · 2017年11月24日

【消息】自动化所获计算机视觉大会ICCV2017场景解析竞赛冠军

【消息】自动化所获计算机视觉大会ICCV2017场景解析竞赛冠军

中国科学院自动化研究所

5+阅读 · 2017年11月6日

相关论文

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

Combination of Multiple Global Descriptors for Image Retrieval

Combination of Multiple Global Descriptors for Image Retrieval

Arxiv

3+阅读 · 2019年4月18日

Object Detection in Videos by High Quality Object Linking

Arxiv

4+阅读 · 2019年4月8日

UPSNet: A Unified Panoptic Segmentation Network

UPSNet: A Unified Panoptic Segmentation Network

Arxiv

4+阅读 · 2019年1月12日

SFA: Small Faces Attention Face Detector

Arxiv

4+阅读 · 2018年12月20日

Re-Identification with Consistent Attentive Siamese Networks

Re-Identification with Consistent Attentive Siamese Networks

Arxiv

8+阅读 · 2018年11月23日

Pooling Pyramid Network for Object Detection

Arxiv

6+阅读 · 2018年7月9日

Object Tracking in Satellite Videos Based on a Multi-Frame Optical Flow Tracker

Arxiv

5+阅读 · 2018年4月25日

Multi-Level Factorisation Net for Person Re-Identification

Arxiv

4+阅读 · 2018年4月17日

AlignedReID: Surpassing Human-Level Performance in Person Re-Identification

Arxiv

7+阅读 · 2018年1月31日

大家都在搜

蓝牙安全攻防

大型语言模型

朱克爱德华兹家族

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

微信扫码咨询专知VIP会员