作者 | 蒋宝尚
从围棋打败李世石,到魔兽世界赢了顶级战队,再到DeepFake以假乱真,人工智能可谓出尽风头。
但AI在各行各业真实水平到底如何,恐怕只有资深业内人士才能知晓。
4月30日,阿里巴巴的华先胜在由信息技术新工科产学研联盟主办的人工智能教育线上公开课中介绍了视觉AI在各行各业中的情况。
他提到,当前的AI落地面临着三个困境,
营收困境,实验与现实的困境,用户需求和成熟技术的困境。
由于这三个困境,尽管人工智能已经落地多年,但想在行业里产生真正的价值仍还具有非常大的挑战。
另一方面,对于一家公司,如何衡量AI落地是否成功呢?华先胜认为关键点在于其业务是否起到了
画龙点睛的作用,即为用户提供了不可替代的价值。
按照华先胜在公开课中所说,2000年到2016年间,全球出现了8832家 AI创业公司,其中百分之八十左右是视觉人工智能公司;对比2000年和2017年,活跃的AI创业公司增加了14倍。
仅在2017年,中国就有167家AI公司获得了总计50+亿美元的融资,其中绝大多数的大公司都专门成立了自己的人工智能实验室或AI部门。
这一切似乎很是繁荣,但实际真正落地,真正产生到价值的却很寥寥。
毕竟,梦想还需经历市场的检验。
站在 2020 这个时间节点上,华先胜指出,AI 公司大多面临三个困境。
这是从价值的角度来衡量,衡量技术是否真正解决现实问题,是否为客户、用户带来核心的价值。营收指标最关键的一条。
实际上AI确实带来了价值,但这并不足够。从创业公司的角度来看,或许也稍有盈利,但是还远没有达到我们期望的状态。目前有超过90%的AI公司处于亏损状态。
从另外一个角度看,目前有许多 AI 项目,但项目不等于产品,产品可以规划化,而项目却是高度定制,需要高人力成本。这是当前 AI 公司存在的一大困境。
也有做API的,但API到底能够产生多少价值,华先胜认为这还不好说,所以事情非常残酷。
当前的AI技术极端依赖数据,但在实验室环境中性能很好的算法测试,在真实世界中却可能表现非常不佳。
以上图为例,在人员重识别上,左边是在公开测试集上的情况,算法获得了非常高的准确率;但拿到真实环境中,人员的衣服、交通工具都会经常发生变化,这就会使算法性能大大降低。
因此实验室的成功,并不等于应用到产品中也同样会成功。这对所有的AI公司都是一个巨大的挑战。
华先胜提到的第三个困境是,成熟的技术和用户需求之间的鸿沟非常大。
当前的AI技术按说已经略显成熟了,但却仍然很难满足用户的所有需求。以上图为例(为保护隐私,图中做了模糊处理),用户有120个真实的需求,但目前AI 真正能够做到的可能只有 20-30个。所以,面对用户高期望的需求,当前的技术仍有很多是不成熟的。
那么这也促使我们思考,到底AI技术成功的关键因素是什么?论文很棒?融资很多?还是估值很高?这些当然都是成功的标志,也是非常重要的因素。
但有一点比上面的都重要,那就是有没有产生核心价值?有没有为应用场景、为用户带来核心的不可替代的价值?
这个价值可以是锦上添花,也可以是无中生有
。
人工智能最关键的一点,是画龙点睛。区别于画龙点须,人工智能让一些事情变得更有价值,更有亮点,
能解决过去解决不了的问题,这就是画龙点睛。
他对视觉 AI 的重点行业做了划分,其中关键行业有 7 个,分别是城市治理、工业生产、媒体娱乐、医疗健康、零售营销、教育培训以及视频通信。
在智慧城市里面还会有交通、平安、市政、能源、环保等等;工业的场景里边有工业的质检、监控、工艺的优化等等之类;医疗里面可能还有影像的分析、有导航、有养老的监护、疫情的防控等等。
另一方面,在这些应用的场景中,华先胜将视觉AI的技术也划分为 7 类,如下图所示:
1、感知理解,这是大家所常见的CV技术,即去理解有什么、发生了什么;
4、增强和生成,例如合成图像,合成视频或者是增强视频的质量;
5、搜索挖掘,这比较偏视觉大数据,能够把大规模的数据索引起来进行搜索;
7、视频/视觉平台,我们不管是做研发还是做部署,都要有平台城去支撑大规模的研发和大规模的部署。
视觉AI的以上7个技术方向,逐渐支撑起了更广泛的应用,人脸识别,物体检测等等技术更是在安防、无人车等领域起着至关重要的作用。
华先胜在演讲中介绍了两项基于视觉AI技术的两个商业案例:视觉搜索和视觉智造。
不同于文本搜索引擎,视觉搜索需要描述视觉对象,视觉对象大多数是图像,其由像素组成。所以
第一步是处理像素,这涉及到特征学习
,即用像素把一幅图变成可以索引的特征。
第二步是大规模索引技术
,主要满足在很大的图像视频数据库里搜索想要的东西的需求。
第三步是高精准的搜索
,也就是在搜的时候能够快速的响应返回结果。
在阿里,这项技术的主要应用场景是电商领域,例如淘宝上面的拍立淘,通过拍照就能在电商数据库中搜索相似商品。
视觉智造和一般的视觉技术不同,传统的视觉技术是分析、识别、搜索,而
视觉智造涉及生成,生成视觉信号
,例如阿里巴巴“Alibaba Wood”,能够1分钟内可以制作多达200个商品展示短视频。
视频的修复增强,已经在各大视频播放平台使用,一些经典的电影经过视觉AI的修复重新焕发了光彩。这也大大节省了人力成本,一个1.5小时的视频,只要两三两三个小时就可以处理完,如果人工的话,则需要40个小时。
还有一个是视频的植入,修改视频内容,比如在不影响观影体验的情况下,植入广告牌进去。
视觉诊断也是视觉AI的主要运用方向,
例如冠状动脉的增强影像的分析,原来需要专业的医生诊断,现在的深度学习方法可以对影像进行准确的分析。另外还有骨科、肺部诊断等等应用。
人工智能已经进入各行各业,势不可挡,发展非常迅猛,但也有很多的局限。
数据产生价值,但并不是把几个东西放在一起炒一炒就能产生价值——我们需要弄清楚价值到底是什么。
当前AI落地不仅是人脸识别这些热门技术,最主要的是要倾向于人力所不能及的事情,即让机器帮助完成人类无法完成的事情。
今天的人工智能方法论,虽然有它不清楚的地方,但在应用领域有很大的空间,需要我们投入大量的人力物力进行研发。
对于传统产业和数字产业,都要拥抱人工智能,对于人工智能从业者来说,也一定要走进应用场景。对于人工智能的商业化而言,最关键的一点就是要创造商业创造不可替代的核心价值,思路可以从锦上添花到画龙点睛再到雪中送炭最后到无中生有循序渐进。
直播主题:CVPR 2020丨数据与模型缺陷:不完美场景下的神经网络训练方法
主讲人:Louis
直播时间:4月28日 (周二晚)19:00整
回放链接:http://mooc.yanxishe.com/open/course/797
直播主题:ICDE 2020 | 华东师范大学×滴滴:利用轨迹数据自动校准道路交叉口拓扑信息
主讲人:刘国平
直播时间:4月29日 19:30
回放链接:https://mooc.yanxishe.com/open/course/810
直播主题:ICLR 2020丨从梯度信噪比来理解深度学习泛化性能为什么这么好
主讲人:刘锦龙
直播时间:4月30日 (周五晚) 20:00整
回放链接:http://mooc.yanxishe.com/open/course/803
扫码关注[ AI研习社顶会小助手] 微信号,发送关键字“ICLR 2020+直播” 或 “ACL 2020+直播”,即可进相应直播群,观看直播和获取课程资料。
阅读原文,直达“直播间”