5月25日-26日,由中国人工智能学会主办,南京市麒麟科技创新园管理委员会与京东云共同承办的2019全球人工智能技术大会(2019 GAITC)在南京紫金山庄成功举行。
在第二天的人工智能开放平台与产业发展论坛上,百度机器人与自动驾驶实验室主任、三维视觉首席科学家、肯塔基大学终身教授杨睿刚发表了主题为《人工智能赋能行业升级》的精彩演讲。
杨睿刚
百度机器人与自动驾驶实验室主任、三维视觉首席科学家、肯塔基大学终身教授
以下是杨睿刚的演讲实录:
我在这里主要介绍百度在开放平台,特别是怎样利用我们的开放平台,对工业进行赋能的一些工作。
人工智能赋能行业升级主要分为两部分,第一部分是百度人工智能整体介绍,重点介绍百度人工智能在工业界和制造界的应用;第二部分介绍百度的智能化工程机械进展。
一、百度人工智能整体介绍
百度人工智能整体布局,主要是 AI 平台,第一层是智能云,就是百度云、算法、算力结合在一起的平台。上面是百度大脑,是对外开放的一个总的出口,在百度大脑上有很多不同应用——AI 落地——可以是金融、智慧交通、制造业等。这个平台是一个工具,好不好用户说了算;同时 AI 能力好不好,最终也要落地,真正让客户、让最终用户进行评价。
在工业上,我们有一个百度天工,它融合了百度 ABC 提供的一站式、全托管的智能物联网平台,从端到云,立足于连接、理解到唤醒的各项关键能力,促进行业变革。
下图是天工云的整体构建,有端存储、云存储,很多计算正在进行边缘化。也就是说,本来很多要在服务器上产生的功能,慢慢在往边缘上部署、边缘的设备,包括一些比较强的计算设备,如自动驾驶汽车有很强的计算能力;以及一些很弱的计算能力,如家居和智能水表的计算。现在把很多的 AI 能力都放到端上去做,传输量比原来降低了 10 倍。总之,越来越多的数据会在本地进行。同时随着 5G 正在慢慢铺开,一些本地不能计算的数据可以放到云上,端口与云有非常紧密的互相工作关系。
下面介绍两个平台应用案例。第一个是风力发电机预测性维护。这里我们在风力发电机上实时采集很多数据后,上传到百度云上,在云上可以对数据进行数据挖掘、数据分析和可视化功能,提高了数据运行效率。第二个是充电桩的智能运维平台。电动车充电是有危险的,对电的管理实际上也是一个可以充分利用 AI 大数据的点,在这方面我们有很多的应用和实际的落地。
百度大脑 AI 服务,也就是开放能力。最底端的有云、云平台、大数据的分析和采集。在算法层面是机器学习平台,国内唯一的开源和开放的平台,Padddle 就在这个层面上。在感知层有云处理、图像处理、视频处理、AR/VR;从感知层再往上走就是认知层。举个例子,如果在语音输入的情况下,拿着手机对它说“我要搜索商品”,首先第一个会调用感知层能力,把语音变成文字;然后就是调用自然语言处理能力,主语、谓语、宾语做分析;最后计算机知道你要问的内容。得到这些结构化结果后,可以在知识图谱、网上数据库里找到需要的知识,这是从感知到认知的处理过程。所有这些能力都把它放在开放平台上,就是 ai.baidu.com,分享给大家。迄今为止,我们有 170+ 项 AI 能力、110 万 + 的开发者,调用量有 4 000+ 亿次 / 每天。
智慧工厂。人脸识别在内部和外部都有很多使用案例,在工业生产上有很多检测、技术、分拣工作,这些工作用深度学习方法,只要有数据,就可以很快地解决问题,得到比较好的结果。
人体识别。如果觉得手机上输入法屏幕太小,没关系,可以凌空写字,也有很好的识别率。我们不仅可以把人体动作识别出来,还希望把人体动作重新呈现。如大家看的小视频,我们可以与人体动作生成视频。
售后服务。我们和太平洋保险合作的项目,是希望能够通过人工智能的方法自动做车辆的定损;就是说,如果不幸发生了车祸,现在一般处理程序就是把车子拉到路边等警察、等定损员来后,判定责任是谁,损失赔付多少钱。我们通过细粒度图像识别方法,让用户首先拍一张照片,自动识别功能可以识别出这辆车是哪年的、型号,以及破损的地方在哪;后面的数据库里有很多数据,如宝马的前灯破了,需要花 2 500 元,定损赔付。这样既提升了保险公司的效率,也降低了用户的时间成本。
阿波罗平台。它是国家新一代人工智能自动驾驶开放创新平台。事实上,平台不仅是开放的,还是开源的,是全球最具活力的开源自动驾驶平台,目前为止大概放出了将近 40 万行的源码,有 130 多家包括汽车和汽车配件厂商、创业企业、研究院校等和我们合作。
阿波罗的构架最底层有一个线控车辆认证,在平台下面是硬件平台,包括了任何和自动驾驶相关的额外硬件(如电脑、 GPS、激光雷达);百度开源软件部分在中间,所有车上运行的软件都是开源的,包括地图、引擎、定位、感知、控制、人机交互等;云端平台主要提供自动驾驶服务,自动驾驶和我们平时开车不一样,它后面有很长的服务体系——高精地图服务、软件服务,是一个从硬件到软件、从端上计算到云端计算紧密结合的一个非常复杂的系统。
阿波罗开源以来,现在已经升到 3.5 版本(见下图),里面有一些新特性。阿波罗实现了在没有红绿灯的情况下左转弯、右转弯;还具有在狭窄路段上超车的能力,为了超车它对环境的感知提出了更高的要求。
仿真平台。我们有最新的渲染引擎仿真平台,一边是仿真的,一边是真实的场景;不仅可以仿场景,还可以仿各种各样动态因素(比如时间,有白天和晚上)。仿真自动驾驶意义越来越重大,从统计学上说,如果自动驾驶通过路测方法保证它的性能,基本上 1 辆车 24 小时不停开,开了十几天以后才能达到统计要求。
度秘。它是一个对话式人工智能解决方案的开放平台,对话式车载系统具有语音、语义、车载信息安全、乘用车多模交互和商用车驾驶员检测 5 大核心能力,把它做到了车里,和自动驾驶更加紧密结合。语音识别和图像识别技术结合在一起,可以给车环境提供更好的体验。
二、百度的智能化工程机械进展
在智能化工程机械进展方面,我们现在做的一个比较有意思的工作就是将自动驾驶能力和对机械臂自主控制能力结合起来,做一个自主挖掘机。创新点是通过立体视觉的能力,做到感知到路径规划、到控制的全套系统。
快速落地、成本可控、全面安全、AI领先是智能工程机械推动未来规模化量产的 4 项优势。
总之,任何一个平台都必须和行业有非常紧密的结合,我们进行各种工业赋能合项目,都用了很长时间去和厂家、用户磨合、协同工作,其中最大的一个困难是,很多做人工智能的人都是学计算机的,真正进入产业里,用户很多的诉求和你想象不同,所以从产业的角度要更加深入地理解客户,解决用户的真正痛点。如果有企业愿意和我们精诚合作,我相信一定会把 AI 从算法、算力最后变成生产力,为祖国的发展,特别是工业制造方面的发展产生更大的作用。
(本报告根据速记整理)
CAAI原创 丨 作者杨睿刚
未经授权严禁转载及翻译
如需转载合作请向学会或本人申请
转发请注明转自中国人工智能学会