对话美团AI视觉专家:GPU计算平台全面升级,AI效率提高百倍

2019 年 9 月 18 日 智东西

看点:美团的AI视觉能力已经渗透到其业务的方方面面。

不知不觉间,AI已经渗透到了生活的方方面面,甚至包括我们所熟知的餐饮外卖。
从商家的菜单录入、招牌识别、到促销时AI自动生成的广告首图优选、外卖骑手的身份验证…… 美团 的AI视觉能力已经渗透到其业务的方方面面。

▲美团视觉图像中心图像视频组负责人魏晓明
近日,智东西来到美团北京总部,与美团视觉图像中心图像视频组负责人魏晓明进行了一次深度对话,全面地解读了美团的视觉AI能力、美团视觉AI平台发展历程、与美团视觉AI背后的“发电厂”。

从菜单录入到AI选图,AI无处不在

魏晓明说,与其他很多企业不同,美团的AI技术有着强烈的业务导向特色。
当前,美团的AI技术主要分为四大类,分别为: 基于AI的语音/语义理解技术、基于AI的视觉处理技术、基于运筹学为主的配送调度优化、以及基于自动驾驶相关的无人配送技术。

▲美团AI视觉布局
魏晓明是美团视觉图像中心图像视频组负责人,有着超过9年视觉领域研发和技术管理经验,此前曾经就职于佳能研究院和三星研究院。
魏晓明2015年加入美团后,主导了超过50个AI视觉项目。 在采访中,魏晓明分别从商户、骑手、用户、平台四个角度,对于美团的典型AI视觉应用场景进行了介绍。

▲AI菜单拍照录入
对于商户而言,美团AI能够让其通过拍照录入菜单,通过文字检测、语义分割、视觉关系学习等技术抽取纸质菜单上的结构化信息,让商户菜单录入的时间由小时级降至一分钟以内。

▲AI招牌识别
随着OCR技术的不断发展,菜单识别、招牌识别等细分场景成为了当前OCR领域的研究热点。 在今年的 ICDAR 2019 上,美团主办了业界首个中文门脸招牌文字识别比赛(ICDAR 2019 Robust Reading Challenge on Reading Chinese Text on Signboards),并公开的业界首个真实场景招牌图像数据集。
此外,商户的证件资质认证、骑手的刷脸认证、用户所使用的AI菜品识别小程序、广告首图优选、骑手抽检等等应用背后,都有着美团AI视觉的加持。


魏晓明说,当前,美团的技术人员有上万人,美团AI视觉团队规模仍在不断扩展当中。

GPU计算平台全面升级,效率提高百倍

美团的AI视觉团队从2015年开始建立,为美团各项业务提供AI视觉能力(比如图像审核、智能选图等),2015-2016年可以看作是美团AI视觉平台的第一个发展阶段。
随着集团内部对于AI算力的需求飙升,2017年,美团进行了企业层面的计算平台全面升级,将从CPU为主的计算平台升级为以英伟达GPU为主的集群化AI计算平台,2017-2018年可以看作是美团AI视觉平台的第二个发展阶段。


在升级为以英伟达Tesla V100 GPU为主的集群化AI计算平台后,美团AI在文字检测、人脸识别、商品识别的离线训练(Training)环节能够达到上百倍的效率提升。
而在应用推理(Inference)方面,当前,美团基于英伟达Tesla P4 GPU + TensorRT的搭配能让计算效率提高数十倍。 而且,美团目前使用的是FP32精度,未来如果使用英伟达T4 Tensor Core GPU进行FP16精度的推理计算,性能将进一步提升。 这种低时延、高实时性的计算性能对于用户与配送员的体验非常重要。


举个例子,为了保障用户的安全,当前美团日活的70万名骑手都已经全面覆盖了“刷脸认证”功能。
但是这项功能为骑手多增加了一道验证工序,对于效率与体验都有影响。
因此,为了保证骑手的人脸比对效率,美团使用了基于GPU并行+TensorRT的方案进行大规模人脸比对的骑手身份验证。 相比于基于CPU方案,这套方案可以加速20倍以上,速度的提升能让外卖小哥“刷脸认证”的过程更快捷、体验更优秀。
魏晓明说,当前,美团服务器集群的AI视觉服务的日均调用已经达到了上亿次。

美团AI的下一步

2018年,结合美团的计算平台升级,美团AI视觉得到了超大规模的落地,覆盖了上文提到的菜单识别、人脸认证、刷脸支付、广告生成等众多集团内部应用场景。

▲美团在CVPR2019-FGVC6商品识别比赛获得第二名
从2019年开始,美团的AI视觉团队已经不仅仅只支持集团内部的AI需求,还逐步在国际大型比赛上进行发声。 2019年,美团AI视觉团队在CVPR、ICME等视觉届知名比赛上都取得了Top3名次。
魏晓明认为,当前AI算法依旧在快速迭代的过程中。 对于美团这种大型平台来说,持续对TensorFlow、Caffe、MXNet等多个深度学习框架进行迭代能够提高计算并行化效率,对于美团特定AI场景的优化十分重要。
下一步,美团AI视觉团队还将对视频理解、门店数字化、无人配送系统等更多AI场景落地进行拓展。

结语:AI应用全面爆发,实时性要求不断提高

随着AI应用的爆发,众多企业都在进行AI计算平台的升级,尤其是涉及刷脸认证、拍照信息检索等实时性要求较高的AI推理应用,传统计算平台已经不能满足需求。

不知不觉间,AI已经逐渐渗透到了我们生活的方方面面,在你不经意间,也许已经享受到了AI带来的生活便利。

登录查看更多
0

相关内容

中国规模最大的独立团购网站,2011-2014年交易额分别为14.6、55、160、460亿元人民币,占据超过50%的市场份额。目前拓展了多项垂直业务,向更广阔的生活服务O2O拓展,包括猫眼电影,美团酒店,美团外卖。吃喝玩乐更便捷、更实惠。
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
“马踏飞”AI机器人实现方案介绍
PaperWeekly
5+阅读 · 2019年8月31日
已删除
将门创投
5+阅读 · 2019年4月29日
已删除
将门创投
3+阅读 · 2019年4月25日
AI in 美团:吃喝玩乐背后的黑科技
AI100
5+阅读 · 2018年12月26日
剖析腾讯知文,智能问答机器人路在何方?
AI前线
12+阅读 · 2018年11月3日
大伽「趣」说AI:腾讯云在多个场景中的AI落地实践
人工智能头条
4+阅读 · 2018年8月1日
手把手教你搭建智能客服系统
InfoQ
13+阅读 · 2018年4月3日
百度NLP模块使用手册--深度直击最新进展
InfoQ
20+阅读 · 2017年10月30日
【人工智能架构】深度解密京东登月平台基础架构
产业智能官
11+阅读 · 2017年9月26日
Arxiv
7+阅读 · 2018年9月27日
VIP会员
相关资讯
“马踏飞”AI机器人实现方案介绍
PaperWeekly
5+阅读 · 2019年8月31日
已删除
将门创投
5+阅读 · 2019年4月29日
已删除
将门创投
3+阅读 · 2019年4月25日
AI in 美团:吃喝玩乐背后的黑科技
AI100
5+阅读 · 2018年12月26日
剖析腾讯知文,智能问答机器人路在何方?
AI前线
12+阅读 · 2018年11月3日
大伽「趣」说AI:腾讯云在多个场景中的AI落地实践
人工智能头条
4+阅读 · 2018年8月1日
手把手教你搭建智能客服系统
InfoQ
13+阅读 · 2018年4月3日
百度NLP模块使用手册--深度直击最新进展
InfoQ
20+阅读 · 2017年10月30日
【人工智能架构】深度解密京东登月平台基础架构
产业智能官
11+阅读 · 2017年9月26日
Top
微信扫码咨询专知VIP会员