【智能+】清华大学教授:邓志东——细分迭代是「智能+」落地的关键

2019 年 5 月 24 日 产业智能官

清华大学智能技术与系统国家重点实验室教授 邓志东


3月21日,己亥年人工智能春季创新大会在北京国宾酒店隆重召开,大会由人工智能产业创新联盟和赛迪传媒共同主办。会上,政府领导、企业领袖以及人工智能领域的资深专家悉数到场,围绕人工智能与实体经济深度融合展开了全面、细致的交流与研讨,各种创新观点融合交汇,为人工智能的创新应用提供了新思路、新路径。


联盟专家委主任委员、清华大学智能技术与系统国家重点实验室教授邓志东分享了关于人工智能落地应用的深层次思考。他指出,人工智能在工业、零售、医疗、客服等领域都实现了创新应用,与此同时,人工智能在实践过程中仍面临一些挑战。


大数据人工智能创新实践面临的挑战

自2013以来,大数据和大计算驱动的深度学习已成为计算机视觉、语音识别与真实感合成、自然语言处理、大数据分析等的主流方法。数据驱动方法已被视为继实验科学、理论模型、模拟仿真之后的第四科学研究范式。正如同网络技术一样,已逐渐变革为一种通用赋能工具,目前已远远超越计算机科学与技术本身的范畴。


以深度卷积神经网络为基础的新一代人工智能,能够获得更加接近于人类水平的视听觉感知能力和对文本自然语言的模式分类能力,带来了超越人类的棋类动态博弈能力。近年来,超人类水平的AlphaGo,引起了社会的强烈关注。特别是AlphaZero,带来了无需大数据且可从零开始进行自主学习的棋类通用人工智能。


对抗性神经网络的最新进展,带来了超真实感的想象能力,两个深度卷积神经网络通过相互对抗来生成超分辨率具真实感的原创图像、声音、3D物体或自然时序数据,这对半监督、无监督学习方法的研究,是一个非常重要的进展。2018年《麻省理工科技评论》把对抗性神经网络列为全球十大突破性技术之一。特别地,基于深度神经网络的目标检测、定位、分割(如语义分割、实例分割与全景分割),自2014年R-CNN问世以来,已取得了非常大的进展。目前的研究重点已超越了简单的分类识别任务,开始进一步研究动作与行为意图的检测与识别。例如,研究基于视觉深度神经网络的表情、手势、动作识别与行为意图预测等,这些都为人工智能的产业渗透带来了更多新的方向。目前,一些典型的人工智能产业应用与创新实践包括:AI刷脸支付、AI无人零售、AI摄像头、AI音箱、AI视频换脸 (虚拟主持人)、 AI速记员、 AI实时翻译耳机、AI手持翻译机、AI语音助手、AI电话客服、AI医学影像诊断、AI-IoT等。


人工智能还赋能自动驾驶的主要细分领域,包括自动驾驶的环境感知与建模、自主导航、决策规划、控制与人机交互(如智能驾驶舱)等。在这个热点产业方向,谷歌已于2018年12月5日正式推出了新的商业自动叫车运营品牌Waymo One,率先在美国凤凰城地区开启了全球首个付费自动驾驶出租车小规模商业化服务。人工智能也赋能于智能机器人产业,无论是工业机器人,还是服务机器人与特种机器人,人工智能相当于模拟机器人的大脑。机器人产业本身要模拟人的手和腿,手要灵巧地操作,腿要灵活地移动。当然,最重要的就是模拟人的大脑,靠人工智能来赋予机器人感知与认知能力。


基于深度学习的计算机视听觉感知方法,需要海量大数据的驱动,目前也缺乏认知水平的理解能力。需要解决的是,如何提供基于小样本的“数据感知+认知理解”能力?此外,在落地应用中,考虑到在开放环境下实际上是不存在完备大数据的,因此对于各种实际应用场景,大数据人工智能均只能获得较接近于人类水平的视听觉等感知能力,这与各种基于公开评测数据集得到的性能极限指标,是完全不同的。总之,就目前的深度学习算法来说,不仅缺乏人类举一反三的小样本学习能力和对目标的认知理解能力,而且不能有效利用常识与记忆,也不能进行基于知识的因果推理。


邓志东认为,中国人工智能创新实践面临挑战,一是我国人工智能技术的原始创新能力不足,基础算法、高端人工智能芯片主要还是以跟踪西方国家为主;二是投资界过于追求短线逐利;三是体制机制障碍,国有巨头型企业前瞻性战略布局不多,投入力度小,民营科技巨头在扛大旗;四是人工智能落地应用面临着诸多困难;五是缺乏高端的基础性研究人才,特别是创新能力强的人才,另外我们还需要大量的人工智能工程开发人员。


同时,他还指出,大数据人工智能的发展,也会带来法律、伦理、隐私安全和失业等方面的挑战。但对人类而言,目前的大数据人工智能总体是赋能而有益的。认知智能与通用人工智能的发展,则将对技术与产业的发展带来真正的变革,但也有可能威胁到人类自身的安全;有必要进行未雨绸缪的研究,预做准备以进行规范制约。


我国于2017年发布了《新一代人工智能发展规划》,把人工智能的发展升级为国家战略,并提出了三步走的战略目标。第三步是到2030年,中国人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心。邓志东认为,成为世界主要的人工智能创新中心这个目标非常具有挑战性,目前仅有10年多一点的时间了。


党的十九大报告提出,推动互联网、大数据、人工智能和实体经济深度融合,培育新的经济增长点,形成新的转换动能。人工智能从2017年开始,已经连续三年写入了政府工作报告。在2019年总理政府工作报告中,人工智能升级为拓展“智能+”,指出要“深化大数据、人工智能等研发应用”,赋能传统制造业转型升级。力争通过新一轮科技革命,加速培育我国新兴产业集群,壮大数字与智能经济,推动产业结构变革。3月19日召开的中央全面深化改革委员会第七次会议,审议通过了《关于促进人工智能和实体经济深度融合的指导意见》,强调必须以市场需求为导向,以产业应用为目标,构建数据驱动、人机协同、跨界融合、共创分享的智能经济新形态。


在国家发展战略与产业政策的推动下,我们看到新一代人工智能的应用场景其实是非常丰富的,比如AI-IoT、5G、VR/AR、智能零售、智能安防、智能手机、智能家电、智能家居、智慧城市、智能制造(例如,零部件的外观质量检查)、自动驾驶、智能机器人、无人机等,而且还正在渗透更多的垂直应用领域。大数据人工智能将无处不在,可望替换更多依赖人类视听觉功能的服务性工种和更多需要环境适应性及自主性的复杂体力劳动。


人工智能与实体经济怎样实现融合?邓志东认为,细分迭代是“智能+”落地的关键,我国要率先努力形成世界领先的人工智能产业生态。随着人工智能的产业渗透不断加快,“智能+”产品的开发与产业发展正处于艰难的深耕期,与实体经济的深度融合方兴未艾。但人工智能的应用场景要细分,要专注于细分场景的大数据实践,有定力、有耐性地积累海量的标签大数据。另外我们还需要在应用实践中不断地进行数据、性能和体验的迭代学习。同时也需要大计算能力等人工智能公共基础设施的有力支撑。但总之,人工智能的发展最终要能给企业和社会创造价值。


“智能+”是一条条“细线”上的人工智能创新应用实践。目前的大数据人工智能创新应用产品,需要细分到特定的应用场景,进行有耐性的打磨。要敢于大胆地推广应用人工智能产品,新一代人工智能技术具有数据学习能力,用户体验可以在应用实践中不断地进行迭代升级,这一点尤其重要。归结起来,只要把每条“细线”上的人工智能落地应用都做到接近于人类水平,涓涓细流汇聚起来,就能大幅度地提高传统制造业的智能化水平。


人工智能创新应用的路径与模式

从“互联网+”到“智能+”,以市场需求为导向,以产业应用为目标,通过数据驱动和跨界融合,推动“智能+实体经济”的深度融合,助力传统制造业的转型升级以及数字经济、智能经济的发展。应以应用场景、大数据、人工智能算法和计算能力四大维度,打通产业链条,推动人工智能的创新实践和应用落地。一句话就是“大数据是基础,算法是核心,芯片是高地,人才是关键,但选定垂直细分领域最重要”。


怎么选定特定的应用场景?人工智能的落地应用,不可能是通用宽泛的,而是要选定一个特定的细分问题入手,一点一滴地开始。实际上,并非所有场景的问题都能由人工智能解决。选择的原则之一就是,能处理的特定应用场景具有较好的数字化、网络化基础,能够源源不断地产生大数据。我们要特别优选信息化基础比较好的行业或细分应用领域。


在各个垂直领域或行业,关键是对垂直领域进行细分再细分。例如,可以优选那些生产环境恶劣、产业价值高或人员稀缺的细分场景。由于目前人工智能的技术突破主要在感知智能领域,所以在各种需要高级熟练工人使用“眼睛”、“耳朵”等感知直觉完成的工作上,若人工智能通过自动学习能够达到熟练师傅“听故障”和“看瑕疵”的水平,这样就可以做到对人工的替代。


为什么说大数据是基础?“智能+”某种意义上就是“大数据+”,因为目前的人工智能就是所谓的“人工+智能”,本质上是把人的经验或直觉判断通过标签的形式转移给机器,然后赋予机器所谓的视听觉“感知智能”。前面已说过,应用落地时的开放环境下并不存在完备大数据,而且还有数据与性能的所谓“长尾效应”,也就是“行百里者半于九十”的意思,因此我们不仅必须尽可能多地积累和运用标签大数据,而且越到后面越困难,就越需要坚持。这也说明,在产业应用中亟需发展基于小样本的深度学习方法。此外,利用“人工”对数据进行清洗和做标签,包括对标签的质量审核等,催生了“标签工”这一新的工种。在应用实践中,需要建立一支工程团队,投入大量人力物力去做数据积累和数据标签,特别是建立高质量的标签大数据。基本上80%以上的人力、物力,都要投入到特定的细分问题上,去深耕应用场景和数据。按照现阶段的算法水平,还不存在一个高大上的万能方法,可以“轻松”地解决所有场景的人工智能应用。我们应以工匠精神深耕制造企业中的细分场景与大数据应用。通过“智能+”打磨人工智能产品,助推与传统制造业的深度融合及品质革命实践。以数据驱动、人机协同,通过“智能+xxx”的跨界融合,加速从基础层、核心技术层、开放平台层到应用层的人工智能产业生态建设,以我国人工智能产业和智能经济社会的快速发展,牵引驱动人工智能基础研究与前沿技术的全面进步。


为什么说算法是核心?基于深度学习的计算机视觉、机器语音、真实感数据生成、词嵌入向量等,作为人工智能算法的主要支撑,已成为“人工智能+”或“+人工智能”的产业核心共性技术,赋能产品、流程与服务体验。在探索下一代人工智能核心算法方面,亟需发展具有类似于人类举一反三小样本学习能力的人工智能算法,具体途径包括与知识图谱结合起来,尤其是与具有学习能力的知识图谱相结合。另外还须发展具有认知理解能力,具有记忆、常识和推理能力的人工智能新算法。比如发展图卷积神经网络,以“深度学习+无监督”的方式进行实体识别,结合概率图模型(知识图谱)抽象、延伸概念,赋以其内涵与外延,以实现对场景或目标的认知水平的理解。


芯片是高地。目前的人工智能芯片主要包括通用人工智能芯片,专用人工智能芯片和类脑芯片。普遍认为,工业互联网、工业物联网、5G通信、云平台和数据中心等,共同构成了大数据人工智能产业应用的硬件基础设施。


人才是关键。人工智能基础算法的创新,核心关键技术的突破,通用人工智能芯片和类脑芯片等高端人工智能芯片产品的研发,对具有原始创新能力的高端人才提出了迫切的需求。随着人工智能产业的迅猛发展,特别是人工智能对各个产业的渗透不断加快,人工智能工程技术开发人才的存量和增量存在严重不足,需求与供给的矛盾日益突出,因此必须加快我国人工智能人才高地的建设。


总之,深度学习主导的新一代人工智能已成为技术与产业的通用赋能工具和科学研究的第四范式,正在变革技术,赋能产品,渗透产业,重塑社会,加速智能经济的发展与智能社会的结构性变革。深度学习方法应用创新实践面临的重大挑战,不仅包括缺乏人类举一反三的小样本学习能力和认知水平的理解能力,而且不能有效利用常识与记忆,也不能进行基于知识的因果推理。人工智能的产品开发与产业发展正处于爆发期,与实体经济的深度融合方兴未艾。“智能+”落地,关键是应用场景的细分与实践过程的迭代。需要特别专注于细分场景的大数据实践,特别是数据、产品与性能在创新应用中的迭代。只有应用落地与用户体验做好了,给企业和社会带来了价值,才能构成正反馈迭代,人工智能技术与产业才能得到进一步的蓬勃发展。从“互联网+”到“人工智能+”,真正以市场需求为导向,以产业应用为目标,通过数据驱动和跨界融合,推动“智能+实体经济”的深度融合,促进传统产业的转型升级与数字经济、智能经济的协同发展。

 

以上内容,来自人工智能产业创新联盟专家委主任委员、清华大学智能技术与系统国家重点实验室教授邓志东在己亥年人工智能春季创新大会上的演讲,经整理编辑。




数据工程基本流程


01

人工智能领域的技术宠儿


毋庸置疑,人工智能正在改变着现在和将来。数据可视化就是人工智能领域诸项技术的宠儿。

  • 数据清洗、特征工程中有它的身影

  • 机器学习、数据分析离不开它

  • 项目评估、商业分析中需要它出手


不仅如此,数据可视化还能作为独立的业务。同时,数据可视化还广泛存在于各种商业、政务、教育等领域的业务表述之中。


下面我们看个例子。


2018 年中美“贸易战”,美国的媒体为了向美国老百姓说明中国经济发展的情况,特别是对美国经济的威胁,一定要使用到中国经济和美国经济相关数字。那么,你觉得这些数字怎么展示?

图 1 常规展示中美 GDP


这是一张预测中美 GPD 走势的图示。看此图,我想,美国人也没有什么太被刺激的感觉,因为看看两条线,未来即使有高低之别,但差别也没有那么吓人,况且,预测还可能不准确呢。

再对比图 2。


图 2 可视化表示中美 GDP


虽然这张图中也包含了数字,但是,它同时配置了表示数字的图示,并且都很形象,人的视觉无形中就被图示所吸引了。把数字本来的抽象意义,用直观方式表达出来,更刺激人的大脑。

这是个普通的数据可视化案例。今天我们想跟大家分享的是数据科学领域的数据可视化。分享的过程中,我们会明白,数据可视化已经成为数据时代程序员的必备技能。


02

数据工程


下图是综合了一些书籍所述和个人工作经验而来的。

图 3 数据工程流程


图的优势是能够把很多信息集中显示在眼前,给人以直观视觉化的体验,这也是“可视化”的优势。



03

理解商业问题


这是“数据工程”的开始,从业者——数据工程师,必须对相应的业务有所了解,这也是数据工程师特有的市场价值之一。


理解商业问题,并非是成为业务高手,而是要能够从业务中梳理出与数据工程项目有关的环节,特别是将业务中某些问题转化为数据问题。


若要从数据层面解决上述问题,就必须把有关数据的问题提炼出来,用准确的语言表述,然后考查业务是否能够支持这些问题。



04

数据收集


数据收集和前述理解商业问题,两者之间是一个互动关系。研究收集数据的方法,也是对商业问题的再度理解。


此外,数据收集还包含着从某个数据集中获得数据的含义。这里所说的数据集,包括但不限于:

  • 数据库,包括关系型和非关系型

  • 数据接口(API)

  • 保存数据的文件,比如 Excel、CSV 文档等



05

数据清洗和特征工程


假设已经通过某种合法的方式“不作恶”的途径得到了某些数据,接下来要做的是了解这些数据,


主要通过以下两种方式:

  • 对数据进行简单的描述性统计

  • 对数据实行可视化,直观地了解数据概况



06

两个分支


有了“训练好”的数据之后,根据商业问题的目标,可以从事两个方面的具体工作。


(1)数据分析

应用各种数据分析的方法,最终得到一份分析报告。分析结果,除了用数字表达之外,可视化是不可避免的(又见“数据可视化”)。


(2)机器学习

机器学习是另外一个专门领域,目前正火热。通过机器学习算法,实现对数据的分类、预测和聚类等操作,在这个过程中,也难免要用“数据可视化”表达某种结论。



07

评估


不论是机器学习,还是数据分析,其结果都要进行评估。


对于机器学习而言,有专门的模型评估方式。根据评估结果,确定是否采用机器学习所获得的模型,亦或数据分析的报告是否被采纳。


以上是数据工程项目的基本流程,从中可知,“数据可视化”并不是流程中的一个独立环节,它是几个环节中必不可少的实现手段。

来源:GitChat精品课

工业互联网+智能制造




产业智能官  AI-CPS


加入知识星球“产业智能研究院”:先进产业OT(工艺+自动化+机器人+新能源+精益)技术和新一代信息IT技术(云计算+大数据+物联网+区块链+人工智能)深度融合,在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的机器智能认知计算系统实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链



版权声明产业智能官(ID:AI-CPS推荐的文章,除非确实无法确认,我们都会注明作者和来源,涉权烦请联系协商解决,联系、投稿邮箱:erp_vip@hotmail.com。




登录查看更多
1

相关内容

人机对抗智能技术
专知会员服务
203+阅读 · 2020年5月3日
【天津大学】风格线条画生成技术综述
专知会员服务
34+阅读 · 2020年4月26日
2019中国硬科技发展白皮书 193页
专知会员服务
83+阅读 · 2019年12月13日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
26+阅读 · 2019年11月19日
2019年人工智能行业现状与发展趋势报告,52页ppt
专知会员服务
123+阅读 · 2019年10月10日
浅谈群体智能——新一代AI的重要方向
中国科学院自动化研究所
43+阅读 · 2019年10月16日
腾讯85页PPT:“智能+”产业互联网生态报告(附PPT下载)
数据科学浅谈
23+阅读 · 2019年5月19日
人工智能的现状与未来(附PPT)
人工智能学家
74+阅读 · 2019年3月27日
【工业智能】人工智能在智能制造中的应用
产业智能官
22+阅读 · 2019年1月11日
【机器学习】机器学习:未来十年研究热点
产业智能官
16+阅读 · 2018年11月4日
清华朱军教授:机器学习未来的几大挑战与目前进展
DeepTech深科技
4+阅读 · 2018年10月29日
1万5千字雄文 | 肖仰华:知识图谱与认知智能
2017中国多媒体大会-智能媒体 创新未来
中国计算机学会
3+阅读 · 2017年8月21日
Neural Speech Synthesis with Transformer Network
Arxiv
5+阅读 · 2019年1月30日
Arxiv
5+阅读 · 2018年5月1日
Arxiv
7+阅读 · 2018年3月22日
VIP会员
相关VIP内容
人机对抗智能技术
专知会员服务
203+阅读 · 2020年5月3日
【天津大学】风格线条画生成技术综述
专知会员服务
34+阅读 · 2020年4月26日
2019中国硬科技发展白皮书 193页
专知会员服务
83+阅读 · 2019年12月13日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
26+阅读 · 2019年11月19日
2019年人工智能行业现状与发展趋势报告,52页ppt
专知会员服务
123+阅读 · 2019年10月10日
相关资讯
浅谈群体智能——新一代AI的重要方向
中国科学院自动化研究所
43+阅读 · 2019年10月16日
腾讯85页PPT:“智能+”产业互联网生态报告(附PPT下载)
数据科学浅谈
23+阅读 · 2019年5月19日
人工智能的现状与未来(附PPT)
人工智能学家
74+阅读 · 2019年3月27日
【工业智能】人工智能在智能制造中的应用
产业智能官
22+阅读 · 2019年1月11日
【机器学习】机器学习:未来十年研究热点
产业智能官
16+阅读 · 2018年11月4日
清华朱军教授:机器学习未来的几大挑战与目前进展
DeepTech深科技
4+阅读 · 2018年10月29日
1万5千字雄文 | 肖仰华:知识图谱与认知智能
2017中国多媒体大会-智能媒体 创新未来
中国计算机学会
3+阅读 · 2017年8月21日
Top
微信扫码咨询专知VIP会员