收获AI技术红利, 我们究竟还没做到什么? 这场会议透露了一些秘密

2019 年 7 月 19 日 机器之能

7 月 19 日上午，「市北·GMIS 2019 全球数据智能峰会」在上海市开幕。7 月 19 日上午，「市北·GMIS 2019 全球数据智能峰会」在上海市开幕。在今天的活动中，多位重磅嘉宾带来了 12 场主题演讲，内容涵盖自然语言对话、认知智能、AutoML 等前沿技术，同时也围绕数据智能经济及产业生态的发展情况进行了深入交流。

撰文 | 李泽南、寓扬

本届大会以「拥抱数智经济，赋能产业生态」为主题，聚焦人工智能学术研究、工程技术与产业应用。「由大数据、人工智能引领的科技革命方兴未艾，正对社会正产生着深远的影响。」上海市大数据中心副主任朱俊伟在大会上表示。「滚滚的数据洪流、超强的云计算大脑、自我进化的机器算法，这些都促成了当前从数据技术向智能化应用的爆发式增长，我们每天的生活都在发生着深刻的变化。」

「我非常高兴能够看到中国在人工智能领域的巨大能量。不论学界、创业公司还是大企业都在开展人工智能研究，已形成了完善的生态，」2018 年图灵奖获得者，MILA 主任 Yoshua Bengio 为大会做了寄语，「我们应该把眼光放长远。今天我们拥有的机器学习系统，其智力甚至不如两岁小孩——我们还有大量工作要做。我们正在研究强化学习、使模型在计算机视觉等应用中学习更好的表征，包括 AI for Good 应用。所有这些都需要全世界范围内大量企业和研究人员的合作。」

用空间信息技术落地精准农业

中科院院士、中国科学院上海分院院长王建宇主要分享了空间信息技术及在大数据中的应用。空间信息技术通过卫星对地球进行了解，主要应用对地观测，导航定位，卫星通信、科学实验等。

去年上海市发布了《上海空间信息领域发展 2018-2035》白皮书，从顶层设计，自主创新，开放合作等四个方面进行规划。空间信息技术就可以为长三角地区的绿色发展、环境保护提供很好的支撑。

他首先介绍了空间分辨率技术，卫星通过对地观测，分辨率越高对地面看的越清晰。比如大家最熟知的气象卫星，不需要太高的分辨率就可以实现对天气的预测，还能用于火灾、沙尘暴、森林破坏等地表变化的监测。在该领域，美国、欧洲、中国走在世界前列。

目前，全球最顶尖的卫星可以做到 0.1 米精确度的空间监测，已经可以清晰的识别建筑物、车辆行人等，很多信息要保密几乎是不可能的。

曾经有报道说，美国卫星水平非常厉害，地上放一张人民日报的报纸，它都能够看到报纸的标题。但今天王建宇院士辟谣道，「这一说法是忽悠人的」。

他还介绍了成像光谱技术的进展，根据光谱，可以识别植被的类别、识别伪装等，在这方面，中国已经走到世界最前列。

接着他着重介绍了空间技术与大数据的融合。一个典型的应用是精准农业，以小麦种植为例，首先通过卫星的对地观测，范围小的可以通过无人机实现，然后依据小麦在生长过程不同阶段光谱的不同，可以判断哪里有了病虫害，哪里需要施肥等。

管理者就可以足不出户，查看农田状况，进行精准作业，还可以判断作为的生长状况，从而通过大数据估算产量。但他也表示，在技术转换成落地应用方面，还需要企业进一步转化落地。

最后他总结道，第一，空间信息技术的发展让我们的地球变小、变清晰，古代说的千里眼，顺风耳对我们已经不是不可能的事情了；第二，通导一体化，给我们带来一个全新的地球；第三空间信息和大数据融合，可以让我们「秀才不出门，尽知天下事」。

AI 开启智能企业时代

欧洲科学院院士、德国人工智能研究中心（DFKI）科学董事 Hans Uszkoreit 在大会上分享了人工智能技术在未来智能企业中的展望。

「看看今天的机器学习，它既可以学习知识，你也可以学习行为。但最成功的学习方法，包括深度学习，是只学习行为，却不学习显性的知识的，」Hans Uszkoreit 表示。「谷歌的机器学习翻译系统并不能理解你的语句，但却能够完成翻译工作，这是因为它的算法从大量数据中学习人类的翻译方法，从而让阅读的人类可以理解翻译后的内容。」

同样的还有现在的自动驾驶系统，它们并不是理解了交通法规——自动驾驶汽车遵守交通法规，是因为他们学习的是行为，而非知识。

「想要实现超越人类的 AI 能力，我们要在基于知识、基于规则和机器学习系统中找到交叉的部分，真正的超级 AI 是超越人类的，但仍然不是人类形式的智能——它不会是伊隆·马斯克所说的超级智能。」Hans Uszkoreit 说道。

目前欧洲学界普遍认为，AI 研究会存在四个阶段：第一个阶段是启发式的搜索，随后是基于知识的系统，目前的第三阶段中，我们开发了学习系统，其中包括深度学习，神经网络等等，并有了大规模的应用。我们现在的挑战就是把这些技术整合起来建立认知系统，其中需要包括大量的知识。

对于企业智能化，Hans Uszkoreit 认为在发展的道路上会有两波浪潮：第一波是数字化，把模拟内容转化为数字内容。在第二波浪潮中，人工智能开始扮演重要作用。其中包括机器人的大规模应用、智能物联网、IT 基础设施的部署、工业 4.0 和商业智能的推进，技术的铺开也意味着智能企业数量的增加。

未来的智能化企业就像人类的大脑，从不同感官收集情报，通过算法帮助人类进行决策，但人类还是必不可少的。「商业决策需要思考大量不同来源的内容。世界是动态变化的，我们不能简单地使用过去知识训练过的算法来对现在的问题进行决策，总会有意外发生，所以这里需要人类把关。」Hans Uszkoreit 介绍道。

另一方面，机器学习算法可以处理大量数据——人类显然无法观察并处理所有数据。今天，知识图谱已经可以在很多领域中帮助我们进行分析和决策了。

通过大数据、人工智能和物联网的进步。智能企业可以实现更好的供应链管理、市场开发、质量控制，所有这些过程都会有 AI 的参与。「我们希望把这些工作结合到一起。连接不同的供应商，将不同的数据以多种形式提供给公司。我们需要处理非结构化的数据，变革公司内部的结构，结合公司内外部生产的不同数据，这样才能实现更为广泛的机器学习。」Hans Uszkoreit 表示。

把当今的企业整合在统一的数据战略下，更好的运用数据，这样才可以让 AI 对与我们有更多帮助。不仅仅是百度、谷歌这样的科技公司，所有传统企业都应该有这样的知识流程。我们需要结合最先进的知识学习。包括强化的学习和主动学习，将显性知识与深度学习算法连接在一起。

李航：不要让系统假装智能

字节跳动人工智能实验室总监、IEEE 会士、ACM 杰出科学家李航分享了自然语言对话技术的发展机遇、挑战，以及他从事对话系统开发的经验。

李航表示，开放域的对话仍面临巨大挑战，各种聊天机器人真正跟你聊起来的可能性非常低。他认为自然语言对话主要有两个问题，一个是自然语言理解问题，语言理解涉及到人类智能的所有的方面，是非常困难的。

另外一方面对话是一种任务，两个人需要能交流感情、交换信息，但在对话系统中，聊天不断被终止、设置、恢复，用强化学习或者规则的方法能够做一些事情，但是真正的去像人一样定义任务、产生任务、完成任务，这涉及到整个人的智能的各个方面，也是非常具有挑战的问题。

未来 5~10 年，一方面要做技术的突破，以提高技术可以达到的上限。另一方面又要将满足用户使用下限的技术落地，从而为用户带来更大的价值。

李航认为，在做对话系统时，我们不光要考虑技术，通过语言做一个交互，还要考虑设计，如何将技术和设计结合起来支持不同的功能。

结合在字节跳动与华为对话系统的开发经验，李航总结了设计对话系统的四条规则：

要能够在一个场景中自封闭，让用户不论怎么说，能够完成一件事情、一个功能。
机器不可能 100% 理解，失败的时候，一定要能比较自然地应对。
对话不仅仅是语言的问题，也包括情感和文化因素，需要加入社交因素让对话更富情感。
第四，不要让系统装智能（是不是暗指获得首个获得公民身份的机器人？）。

需要强调的是，当下的对话系统解决了一部分问题，但用户真正痛点的问题还没有真正的解决，商业化的关键，是一定考虑到怎么样给用户带来真正的价值。

人工智能多模态的未来

香港中文大学终身教授、腾讯优图实验室杰出科学家、IEEE Fellow 贾佳亚向我们介绍了人工智能发展的现状，以及多模态方法的未来。

「媒体、投资人、各类公司的创始人和高管都在问我，人工智能现在发展到了什么阶段？我们对于它的乐观可以持续多久？」贾佳亚表示。「我对这些问题有很长时间的思考，直到现在终于整理出了自己的观点。」

对于 AI 的发展现状，我们可以参考人工智能顶会的论文数量。过往五年每年的 CVPR 大会投稿数目都有 50% 的增长，在 2020 年，预计投稿数目会达到 7000 篇左右。论文数量的猛增意味着大量研究人员正在加入这一领域。在自然语言处理领域里，ACL 大会今年因为 BERT 的突破性进展导致论文投稿数量突然提升了一倍——新的突破让很多问题变得可解了。

但是我们在 CVPR 论文的文字云中几乎找不到「Language」，在 ACL 大会中也几乎找不到「Visual」。这从一个侧面说明了今天人工智能的发展现状：每个方向的研究都在蓬勃发展，但这些领域基本上都是分离的。「虽然大家认为人工智能是一个整体，但现在实际上是一个个孤岛，视觉、自然语言处理等方向互相独立。」贾佳亚表示。

任何一个领域的发展都是以单点突破为方式发展的，从深蓝、AlphaGo 到 ImageNet、德州扑克 AI、OpenAI Five 在 Dota2 上的技术突破都是这样。但只有当所有组件整合在一起的时候，我们才能真正收获技术发展带来的红利。

多模态是人工智能的基础难点，机械要做到这一点需要识别图像、分析 3d 模型，分析结构化信息，认识文本，识别声音。

「下一代产品会最先出现在哪个方向？应该不是机器人。在未来 20-50 年里机器人仍然无法达到人类小孩的智商水平，」贾佳亚表示。「我认为会是汽车，它有多种传感器，需要强大的处理能力。车这个行业未来可能会有翻天覆地的变化。」

如果我们对机器人说：请给我桌子上左边的瓶子。AI 解决这个问题需要语言模型、三维建模、自动导航、图像分析等多种能力。对于人类来说非常简单的一个问题，对于机器人来说却是非常难完成的——我们需要对不同的模型进行监督训练。我们今天看到的机器人都只能进行非常简单的操作，这意味着未来技术的发展还有非常多的空间。

在多模态 AI 方面，腾讯优图也已有自己的工作。其推出的手语翻译器可为国内 7200 万听障人士提供帮助。「中国有 5% 的听障人口，这个数字非常大，但是人们没有意识到，」贾佳亚介绍道。「你的微信朋友圈可以有几百人，但很可能一个残疾人都没有。这是一个可怕的现象：我们的社会和他们的社会是相互隔绝的，完全没有交集。」

这就是腾讯开发多模态 AI 手语翻译的动力。手语识别是一个多模态的问题，需要有姿态识别、动作识别、语义转化和语言模型这个翻译器是很有趣的工具，它对社会也很有意义。

除此之外，开发者们在内容平台上实现了很多交叉融合，通过视频内容和字幕文本，AI 可以对视频内容进行精准理解。这在视频平台上已经收获了不错的反响。

「人工智能近年来的发展令人振奋，多模态人工智能是未来的方向。大家不用过分乐观，也不用过分悲观。走下去或许还有十年二十年。希望大家对于人工智能保持谨慎乐观的态度。」贾佳亚表示。

从 AutoML 到认知智能：AI 前沿研究趋势

下午，多位业界人士围绕机器智能的前沿研究趋势进行了演讲。

复旦大学教授，极链科技首席科学家姜育刚的演讲以视频 AI 技术的发展为题。人工智能视频的生成，DeepFake 换脸是最近人们热议的话题，这种技术如果被滥用，可能会带来很大威胁。

极链科技致力于开发视频检测系统，面向电影、电视剧、综艺、短视频、广告等种类的视频。不同内容的场景复杂，难以控制，在这样的内容上做视频识别难度很大。极链科技提出的视频 AI 技术可以理解视频内容，经过 AI 处理的视频可以在中间插播具有关联性的广告，让用户产生更多的场景共鸣。

「我们都知道 ImageNet 对于计算机视觉领域的发展贡献很大，然而在视频领域，YouTube8M 和 ImageNet 相去甚远，」姜育刚表示。「极链科技和复旦大学希望通过举办 VideoNet 视频内容识别挑战赛，形成新一代视频识别算法评测标准。」

Video-Net 是一个新类型的数据集，其中包括业内标注粒度最为精细的视频数据，全面覆盖视频中事件、动作、物体、场景等工作。姜育刚希望通过这项工作，让人工智能也能根据场景推断其他物体。

人工智能不仅可以在娱乐方面提升体验，也可以帮助人们获得更好的教育。松鼠 AI 的崔炜探讨了如何使用人工智能提高学生的学习效率。

「人工智能的自适应学习或许可以实现千人千面的教育，」崔炜表示。「AI 和教育的结合可以帮助孩子获得更好的学习能力。即使在未来知识本身被遗忘，学习方法在生活和工作中也可以帮助他们不断获取新的知识。」

松鼠 AI 开发的 K12 智能教育产品，做到了精准的诊断和高效的「治疗」。可实现实时的学生画像更新，了解学生的知识状态，为学生规划最佳学习路径，进而实现个性化的学习内容推荐。最大化提升学生的学习效率。在没有老师干预的情况下，人工智能系统可以帮助学生自行完成目标。

「基于信息论和知识空间理论的知识诊断可以使用最小的题量，最短的时间内诊断出学生的知识漏洞，」崔炜介绍道。「而基于贝叶斯认知诊断模型的知识状态评测可以考虑相关知识点，以及历史学习记录，更准确地评估学生的学习状态。」

深度好奇创始人、CEO 吕正东为我们分享了认知智能对于行业的帮助：「这是一种高级的，对于人类抽象思维的模拟，其中包括理解、推理，对于知识表达的使用。人类能够轻松地理解自然语言，在解答问题时可以使用大量知识。」

对于深度学习模型来说，解决真实世界的大多数问题是非常困难的。新一代的神经符号智能需要三个维度的特质：拥有类似人脑的多异构处理器，算法机制基于联结主义和符号主义，学习过程采用非监督、弱监督学习（强化学习）并与有监督学习进行有效混合。这或许就是下一代人工智能的范式。

深度好奇在近几年来主要的技术框架有关解析和推理。解析框架以神经网络的中央控制器驱动多个符号规则的协处理器，可以像人类一样阅读和理解长篇文章，它会将阅读当做一个复杂的决策过程，总结并进行理解和推理。

推理框架有关图结构计算，采取混合态的表示，以「神经·符号」方法进行多通道运算，对规则性知识进行动态查询和吸收，其推理过程可解释。

第四范式的涂威威回顾了自动机器学习技术（AutoML）的近期发展：「机器学习是非常复杂的技术，从最早的定义问题，导数据的收集和处理，最后的模型应用是非常复杂的过程。以往只有机器学习专家才能胜任这样的角色。」

AutoML 可以将技术平民化，通过自动机器学习的方式让更多的人来完成专业的人工智能算法构建工作。人们在这个领域研究了很长的时间。AutoML 是在有限系统资源情况下把机器学习系统实现最优配置的方法。机器学习的配置、评估配置的效果是需要了解的问题，高效求解的方法则是研究的目标。

AutoML 的未来会有哪些发展趋势？从配置空间来讲，我们需要寻找更紧致的精确控件以降低算力开销，提升评估的精确性。自动半监督学习（AutoSSL）已经可以自动预测数据的标记，实现很好的训练效果。此外，神经网络架构搜索工作适用范围仍然狭窄，未来自动的图像分割、自动文本分类或许可以为图像分类之外的机器学习方向带来更多的可能性。

为了解决更多现实问题，我们可能需要交互式的自动机器学习系统（Interactive AutoML）：让人做人类擅长的事物，机器做机器擅长做的事。通过实时交互的方式，最终让人们探索适合解决问题的高效机器学习算法。

AI 为汽车行业带来 DNA 级革命

在数据智能产业化落地方面，上海市经济和信息化委员会介绍了 AI 在学校、医疗等场景的落地，上汽重点介绍了 AI 为汽车行业带来 DNA 级的革命，上海电气则介绍了 AI 在能源管理中的智慧预警。

首先，上海市经济和信息化委员会裘薇女士介绍，去年 12 月，上海在国内率先提出「上海市人工智能应用场景建设实施计划」，解决 AI 公司技术落地和产业对 AI 需求的匹配问题，主要聚焦教育、医疗、制造业、城市管理等重点领域。面向十个场景，上海吸引了全球超 170 份解决方案，其中微软、IBM、BAT 等国际知名企业均参与其中。

在具体落地上，上海闵行蔷薇小学通过智能课堂行为分析系统，对课堂学习情况进行量化评估，指导教学实践；还借助计算机视觉、深度学习、数据挖掘等技术，实现综合分析学生课内课外行为。

复旦大学肿瘤医院开发了挂号预约系统，通过上传患者近期病情信息，可用 AI 文本识别、语音交互等方式进行病情诊断，推荐合适的就医路径；还通过医疗语音录入系统，帮助医生快速录入病历和报告，准确率达 97% 以上；推出智能辅助诊断系统，降低乳腺 X 光的漏诊、误诊情况。

下一步工作，上海会打造场景示范区，聚焦「大场景」，突出高端引领，破解痛点问题。

工业互联网时代，汽车一直扮演着工业进化中的明珠。上汽乘用车公司首席数据官张亮称，AI 和数据智能正为汽车行业带来 DNA 级的革命和重塑。

他表示，上汽在 2016 年推出中国首款互联网汽车，至今互联网汽车已经销售 70 万台。

汽车行业 130 多年的发展，主要基于经验的积累，来建立标准。但张亮称，用经验建立标准存在 4 个不足：1. 具有极强的冗余性；2. 标准的不完整性；3. 用户使用中存在偏差；4. 过去标准主要聚焦实物标准，缺少感知标准。

而随着 AI 的到来，将数据连接到一起，为产品的研发、故障预测、故障诊断，以及售后的质量问题解决等都带来可能。比如电池寿命是新能源汽车中大家最担忧的一个问题，上汽推出一款电池医生产品，基于使用习惯可以预测电池寿命。

「真正改变汽车行业的是智能研发平台」，张亮称，上汽在前期产品的目标设定、产品研发方案、虚拟平台仿真等都用到了数据的回流，进行产品定义，加快研发节奏，满足精准需求。

他还透露，荣威 RX5 MAX 将在今年下半年上市，将会是全球首款量产的智能座舱。

接着，上海电气智能中心主任黄猛介绍了 AI 在能源管理中的应用。上海电气风电集团是一家智能制造企业，风力发电机是它一项重要业务。

黄猛称，风力发电机往往安装到偏远地区，在运维中往往存在很多难题，比如如何通过数字化手段进行集中管理；远程管理风机时，如何让数据有效的接入进来；以及如何通过搜集的数据进行健康预警来避免故障。

数字化、大数据、AI 技术在能源管理中能够发挥很大作用，但这些技术与实际应用落地还有距离。

他表示，在能源管理中，最关键最核心的是智能故障预警，通过海量历史数据，提取特征，用机器学习进行模型训练，可以进行有效的故障预警。比如在上海东海大桥的风电场，对风机中的关键部件齿轮箱进行健康预警，可以提前十天左右发现故障，从而进行小范围检修，从而节省非常高的成本。

此外，到 2021 年国家将取消风电补贴，在降低成本提升效率，数字化、AI 技术将会起到重要作用。

在最后的圆桌论坛上，金棕榈企业机构董事长、CEO 潘皓波，小 i 机器人高级副总裁杜玉清，华润微电子控股有限公司应用技术研究院工艺集成首席专家李铁生和中译语通科技副总裁、首席技术官程国艮一通探讨了实体经济与数据智能融合的挑战和机遇。

「我们和国内大型金融机构合作多年，这些银行在近几年业务量增长 20 倍，网点数增加了 6 倍，但是整个客服体系和业务人员其实没有增加，反而从原来的四千人减少到了两千四百人左右，」小 i 机器人高级副总裁杜玉清表示。「在这其中大数据应用起到了很关键的作用。AI 解放出来的人力，并不会形成裁员，而会解放出来从事系统管理、数据分析等更具创造性的工作。」

潘皓波则认为，人工智能公司未来会形成 B to C 服务的群体，如导游领队、私人医生、法律顾问、咨询师等等。过去的金字塔形组织架构会变成一个大平台加上「超级个体」的形式。