AI一周新闻盘点：北约设计网络防御AI；谷歌训练代理进行自我设计和逆向推导

会员服务 ·

AI一周新闻盘点：北约设计网络防御AI；谷歌训练代理进行自我设计和逆向推导

2018 年 4 月 4 日 AI前线 Jack Clark

作者｜Jack Clark

译者｜核子可乐

编辑｜Debra

AI前线导读：

快速对象检测工具YOLO迎来第三个主要版本
军用AI问世：研究人员详细介绍MiSpec防御参考架构
谷歌研究人员们训练代理进行自我设计，并立足目标实现逆向推导
AI研究人员培训代理以建立思维模拟过程，从而实现卓越表现
在玩具世界中利用玩具车测试自动驾驶汽车
利用深度学习技术区分探测到的不同行人
法国领导人马克龙讨论法国的国家人工智能发展战略
伯克利利用SqueezeNet的继承者“SqueezeNext”实现神经网络收敛

快速对象检测工具 YOLO 迎来第三个主要版本：

…该项目的技术论文，则堪称近期内公布的表述最清晰、也最具说服力的研究报告之一！…

YOLO (You Only Look Once，即‘只看一眼’) 是一款速度极快的免费物体检测系统。其最新的 v3 版本通过整合“来自其他人的好点子”将速度表现推向更高水平。其中包括用于特征提取的残差网络系统（这套系统在 ImageNet 分类方面拥有相当高的分数，在效率上优于目前最先进的系统）以及一项受到特征金字塔网络启发的边界框改进方法。轻松可信: YOLOv3 论文可能是近年来我见到过的，最易于理解的人工智能研究论文，这是因为其并不会“太把自己当回事”。下面来看一段内容摘要：“我今年投入在研究工作中的时间并不太多，反倒是经常泡在 Twitter 上，还尝试了一下 GAN（即生成对抗网络）。利用剩下的精力，我对 YOLO 做出了一点点改进；但说实话，这部分工作仍然充满趣味，也确实让它变得更好。”这篇论文中还提供“我们尝试但未能实现的目标”章节，应该能够帮助其他研究人员节约大量时间。

为何值得关注: YOLO 使得业余爱好者们也能够轻松访问最先进的物体探测器，从而更轻松地将这类系统部署在真实世界的硬件当中——例如能够与之匹配的手机或嵌入式芯片与网络摄像头。但 YOLO 这样的系统也存在一些弊端：由于实用性极高，因此恶意人士很有可能对其加以利用。研究人员们在“这一切意味着什么”章节当中提到，“我们该如何利用这些探测器做些什么？”参与此项研究的相当一部分人员来自谷歌与 Facebook。所以我想这些技术或多或少会被用于收集用户的个人信息并将其销售给……哦哦，说的是用途，跑题了。军方无疑是物体识别的主要资助方，而且乐于利用此类新技术摧毁生命。

了解更多： YOLOv3: 增量式改进 (PDF 格式)。更多关于 YOLO 官方网站的详细信息。

军用 AI 问世：研究人员详细介绍 MiSpec 防御参考架构：

…北约研究人员勾勒出基于人工智能技术的自动化网络防御系统…

由美国陆军研究实验室领导的某北约研究小组发表了一篇关于网络防御代理参考架构的论文，该代理能够利用人工智能技术增强自身能力。这篇文章之所以值得一读，是因为其中涉及全球各国正以怎样的视角看待关于人工智能的一切：AI 系统能够进一步扩大自动化覆盖范围、提高采取行动的速度、针对特定敌对方获取战略主动权，因此其中的主要技术集成目标在于尽可能实现流程自动化、提升响应速度、最终在对抗中获取主动权。

“人工网络猎手“: 研究人员们写道，“在与高技术水平的敌对方发生冲突时，北约军事战术网络将面临激烈的对抗——敌方软件网络代理（即恶意软件）将渗透友军网络并攻击友方指挥、控制、通信、计算机、情报、监控与侦察（简称 C4ISR）以及计算机化武器系统。为了应对这一切，北约也需要自己的人工网络猎手——专门负责主动网络防御工作的智能化、自主移动代理。”

代理的运作方式: 研究人员提出了代理的五大主要组成部分：“感知与世界状态识别”、“规划与行动选择”、“协作与谈判”、“行动执行”以及“学习与知识改进”。这些功能中的每一项都包含大量用于实现对应效果的子系统，例如从代理的操作行动中提取数据，或与其它代理进行通信与协作。

使用场景: 这些代理将以模块化形式存在，并能够通过多种不同形式在各类使用场景下得以部署——包括在车载武器、导航与观测系统中乃至作战人员使用的笔记本电脑中部署，并统一归“主代理”指挥。在这种情况下北约研究人员详细说明了车辆在维修过程中面临的病毒入侵威胁 ; 该病毒会被在扫描车辆内其它子系统时被某个代理检测到，通过协作体系车辆上的各个代理都将因此下调对“车辆管理系统”的信任度并将 BMS（一套用于调查周边区域的车载系统）转换至警戒状态。接下来，其中某个监控 AI 代理发现短文恶意软件已经将攻击代码加载至 BMS 当中，这时对应 AI 代理会自动重启 BMS 并将其重置为安全状态。

为何值得关注： 随着此类系统从参考架构转变为现实功能代码，人们在冲突当中选择的攻击策略将更为多样，意味着战争活动的本质也将由此发生变化。幸运的是，由于攻击技术往往较为粗糙、脆弱且难以随时预测，因此就目前而言人工智能技术还大多集中在防御层面。

了解更多：网络防御智能自主代理的早期参考架构 (Arxiv)。

谷歌研究人员们训练代理进行自我设计，并立足目标实现逆向推导：

…从长期任务执行的角度出发，智能代理的表现更为出色…

在尝试解决某项任务时，我倾向于进行两方面思考：整理我认为完成任务所需要采取的步骤，而后立足最终目标逆向推导执行过程。如今，大多数人工智能代理只能完成前一部分工作，即持续探索（通常没有一个明确的最终状态定义）直到发现正确的行为。如今，谷歌 Brain 小组的研究人员提出了一种受限方法，帮助智能代理实现这种逆向推导能力。他们的方法要求用户向代理提供与奖励机制相关的知识，特别是目标——这一点对于当前的大多数人工智能系统而言还无法实现。在考虑下一步行动时，代理能够利用这些信息从当前状态进行回推，并利用目标意识到自我审查，从而帮助其搭建更好的行动选项。这种方法适用于需要大量探索的规模化任务，例如在网格世界中进行导航或解决汉诺塔问题。不过由于仅涉及部分最简单的玩具测试，因此从这篇文章中我们还不清楚这项技术能够走得多远。

为何值得关注： 必须意识到，我们在处理工作时总会被限制在自身的主观视角之内。因此要开发出更为高级的人工智能系统，我们首先必须将更多的时间增量作为特定上下文标记，并利用其管理环境建模。

了解更多： 前向 - 后向强化学习 (Arxiv)。

AI 研究人员培训代理以建立思维模拟过程，从而实现卓越表现：

…我的成就取决于我的想象力…

很多朋友可能听说过投篮培训的故事。科学家们将一群人分成三个小组，第一组在测试周期内不能接触篮球 ; 第二组每天可以打一个小时篮球 ; 第三组每天可以拿出一个小时在头脑中模拟篮球比赛，但不可实际操作。最终，这三个小组进行对抗，而科学家们发现虽然无法与每天打球的小组抗衡，但每天模拟球赛的小组仍然远远胜过既不摸球、也不想球的小组。这意味着大多数人类都拥有着强大的直觉：我们的大脑是一套出色的仿真引擎，我们用于模拟问题的时间越长，实际将其解决的可能性就越高。如今，研究人员 David Ha 与 Juergen Schmidhuber 希望通过训练系统以帮助人工智能获得自己的这种思维模拟能力。在研究案例当中，他们希望 AI 能够通过这种方式学会驾驶塞车，并最终在 VizDoom 中解决相关挑战。

值得注意的部分: 虽然论文本身确实很有趣，但学者 Shimon Whiteson 认为这种研究方向可能走不了太远。感兴趣的朋友可以点击相关链接查看其几天前针对这篇论文发布的推文评论。

令人惊讶的迁移学习: 对于 VizDoom 任务，研究人员们发现其能够通过提高环境模型的温度让整个挑战变得更加困难——换方之，这实际上是增加了各种潜在变量的随机化程度。代理将不得不面对更多的敌人、更难以预测的火球甚至偶尔出现的不可避免的死亡。他们发现，通过这一模拟环境训练出的代理能够在简单的现实任务当中拥有出色的表现，这意味着只有具备理想的仿真度，这种心理模拟层面的潜在学习环境完全可以有效提升代理的任务处理能力。

为何值得关注：“想象力”在人工智能研究领域属于一项专用术语，但同时也是个有趣的常规概念。想象力让人类得以高效探索周边世界，也为人类提供充足的动机与不可预知的心理变化，从而造就诸多发明及见解。因此，本篇论文中所提及的系统力图让 AI 代理获得类似的周边环境学习与概括能力，并借此建立自学能力。作为将数据增量应用至环境当中的另一种独特方式，这种新的思路也非常有趣：只需要将代理投入至真实环境当中，人工智能就会学习环境的内部机制，并最终培养出能够与真实场景相对接的泛用性任务解决能力。

推荐阅读: 这篇论文可读性极强且非常有趣。我希望能有更多的论文通过这样的方式拉近与普通读者的距离，这也是让更广泛的受众接触并熟知科学成果的理想方式。

了解更多： 世界模型 (Arxiv)。

在玩具世界中利用玩具车测试自动驾驶汽车：

…将神经网络置于（高度受限的）测试当中…

佛罗里达大西洋大学复杂系统与脑科学中心的研究人员们利用玩具赛道、DIY 模型车以及七种不同的神经网络方法来评估受限环境下的自动驾驶汽车功能。该项研究希望实现一种成本低廉且可重复的基准测试程序，以供开发人员评估不同学习系统并与其它方案进行比较（目前尚不明确此项基准是否与全尺寸自动驾驶汽车有关）。研究人员们立足同一平台测试了七种神经网络类型，包括一套前馈网络、一套双层卷积神经网络、一套 LSTM、Alexnet、VGG-126、Inception V3 以及 ResNet-26。他们利用障碍路线对经过训练的各套网络进行测试，并根据车辆所能完成的圈数进行效果评估。此外，他们在测试当中主要使用三种数据类型——彩色单幅图像、灰度单幅图像以及灰度帧堆栈（即一组图像序列）。大多数系统都能够顺利完成测试路线，这表明路线设计有些太过简单。其中基于 AlexNet 的系统在灰度单幅图像条件下表现最佳，而 ResNet 则在灰度帧堆栈条件下表现最佳。

为何值得关注：这篇论文再次凸显出我们目前对自动驾驶汽车系统的了解还非常有限，而我们所采取的策略测试与评估方法也相当粗糙。这意味着即使投入大量资金在实际道路上进行测试，效果恐怕也无法尽如人意。不过考虑到利益的驱动，相信各大技术厂商会想办法解决这一难题。

了解更多： 自动驾驶汽车深度学习架构的系统性比较 (Arxiv)。

利用深度学习技术区分探测到的不同行人：

…AffineAlign 技术的漫长探索道路…

随着全球范围内人工智能监控工具的大规模部署，研究人员们正忙于解决该项技术中的一些现有缺陷。图像分类器目前面临的主要挑战之一，在于如何实现对象区分与消歧。举例来说，如果我们面对一张包含大量个人的图像，要如何为每一个人物添加标签并开展针对性追踪，且不致误标他人或在人群中失去目标？清华大学、腾讯人工智能实验室以及卡迪夫大学联合进行的最新研究试图通过“基于姿态的全新人体实例区分框架解决这个问题。这套框架将基于人体姿态——而非区域——以检测并区分目标实例。”其提出的具体方法为引入“AffineAlign”层，该层利用典型计算机视觉处理流程中的人体姿态分析功能进行图像校准。他们决定将更多原有知识（特别是与人类姿态相关的知识）引入到识别流程当中，借此更好地识别并区分包含大量人物对象的图像中的各个人体。结果：这套方案在 COCHUMAN 数据集上获得了与 MASK-RCNN 类似的结果，而在 COCOHUAN-OC 数据集（主要测试系统对拥挤人群内对象的识别能力）上则效果更好。

为何值得关注： 随着 AI 监控系统的不断发展，世界各地的各类组织机构可能会将其部署到现实世界当中。中国目前正处于这一领域的前沿，因此中国研究人员的相关成果自然也值得高度关注。

了解更多： Pose2Seg：无需检测实现人体实例区分 (Arxiv)。

法国领导人马克龙讨论法国的国家人工智能发展战略：

…为何人工智能将引发民主问题，法国为何希望在欧洲占据 AI 技术领先等等…

政治家类似于风向标加指挥棒的结合体 ; 政治家的工作就是在公众情绪发生变化之前进行直觉测试，并建立适当的方向对此加以引导。出于这个原因，从加拿大的特鲁多、到中国国家主席习近平，再到法国总理马克龙，目前越来越多的政治家们开始对人工智能的战略意义抱有浓厚兴趣。这意味着他们已经意识到，人工智能将成为普通群众当中的热门议题。马克龙在接受《连线》杂志采访时讲述了他对于人工智能技术相关影响的一些看法。他的主要论点是，欧洲各国需要集中资源与人力以支持人工智能发展，从而成为一股重要的人工智能力量，最终避免被美国及中国庞大的人工智能生态系统所压垮。他强调称：– 人工智能“将颠覆一切不同类型的商业模式”，法国需要在人工智能方面保持自身的领导地位。– 向 AI 系统开放一般用途数据就像是打开了潘多拉魔盒：“在利用这些数据建立新型业务的同时，我们就意识到其既可能带来巨大机遇、也会导致巨大风险。其甚至可能完全破坏我们的民族凝聚力以及人们共同生活的方式。在我看来，这意味着：这场巨大的技术革命，在本质上也是一场政治革命。”– 美国与中国是目前人工智能领域的两大巨头。– “人工智能有可能彻底破坏民主制度。”– 他坚决反对将致命武器的决定权交给机器。– “我担心的是快速创新与部分现实因素之间存在脱节，以及人们在我们民主制度下习惯这一切所耗费的时间。”

了解更多： 埃马纽埃尔·马克龙对话《连线》，探讨人工智能发展战略（〈连线〉）。

法国披露其国家人工智能发展战略：

…曾获菲尔兹奖章的法国政治家 Villani 发布最新人工智能发展报告…

过去一年以来，法国数学家兼政治家 Cedric Villani 一直在积极为政府制定一份人工智能发展战略报告。他现在已经正式发表了这份报告，其中包含大量重要建议，旨在帮助法国乃至整个欧洲找到一条不逊于中美两个 AI 超级大国的发展路线。

总结： 以下是法国人工智能战略的内容摘要：重新考量数据所有权，帮助政府更轻松要建立起大型公共数据集 ; 专门于四大部门——医疗卫生、环境、交通运输以及国防安全 ; 建立并资助跨学科研究项目 ; 创建国家计算基础设施，包括“专为人工智能领域使用的超级计算机”以及欧洲范围内的 AI 研究私有云 ; 提高公共部门薪酬竞争力 ; 资助一座公共实验室，用以研究人工智能及其对劳动力市场的影响，并将结果与未来私营部门的人员专业培训项目加以结合 ; 增加人工智能系统的透明度与可解释性，旨在解决偏见问题 ; 建立全国人工智能道德委员会，为政府提供战略指导以改善人工智能企业的多样性。

了解更多： 法国人工智能发展战略摘要英文版 (PDF 格式)。

伯克利利用 SqueezeNet 的继承者“SqueezeNext”实现神经网络收敛：

…最终成果在运行速度与使用成本方面皆远远优于 ImageNet…

伯克利大学的研究人员们发布了“SqueeseNext”。该项目尝试将大型神经网络的功能浓缩为小型模型，从而确保其能够被部署在内存容量与计算能力较为有限的小型设备当中——例如智能手机。尽管目前的人工智能系统大多立足于特定数据集构建而成，但 SqueezeNext 却专注于将此类系统转化为可部署平等轨道的组成部分。作者们写道，“神经网络设计的一般性趋势在于找到更大更深入的模型，从而在不考虑内存或功耗预算的前提下获得更高的处理精度。”

工作原理： SqueezeNext 之所以如此高效，主要源自以下几项设计策略：低级过滤器 ; 用于限制网络参数数量的瓶颈过滤器 ; 在瓶颈过滤之后傅单一完全连接层 ; 固定权重与输出 ; 与硬件模拟器协同进行网络设计，从而最大限度提升硬件使用效率。结果： SquuzeNext 网络当中的参数数量仅为 AlexNet 中模型参数的 112 分之一（AlexNet 曾于 2012 年被评为最先进图像识别方案）。另外，研究人员们还开发出一套网络版本，其性能与 VGG-19 接近。研究人员们也设计出一套效率更高的网络体系，通过与硬件仿真器并行运作以调整模型设计，最终设计出比目前已经得到广泛使用的 SqueezeNet 速度更快且功耗更低的模型方案。

为何值得关注： 之所以要反其道而行之，主要是考虑到目前的神经网络往往需要巨大的内存与计算资源——考虑到目前大部分科学家仍在利用多层系统解决各类任务，相信这样的状况仍将持续存在。因此，建立“浓缩型”模型并提高网络运行效率的尝试，将能够有效拓展神经网络所能对接的具体场景数量。

了解更多： SqueezeNext: 硬件感知型神经网络设计 (Arxiv)。

作者 Jack Clark 有话对 AI 前线读者说：我们对中国的无人机研究非常感兴趣，如果您想要在我们的周报里看到更多有趣的内容，请发送邮件至：jack@jack-clark.net。

原文链接：

https://jack-clark.net/

阅读原文链接：https://jack-clark.net/

AI前线-01.png