AI前线一周新闻盘点：中科院通过ParallelEye建立虚拟北京，英伟达变更GPU许可

会员服务 ·

AI前线一周新闻盘点：中科院通过ParallelEye建立虚拟北京，英伟达变更GPU许可

2018 年 1 月 2 日 AI前线 周报来咯

作者｜Debra

译者｜核子可乐

编辑｜Emily

内容导读：一周一度的盘点新鲜出炉，各位看官接好了~

微信广东试点“微信身份证”
百度 Apollo 全线产品将在 CES 展亮相
柯洁“食言”：明年再战 AI
中科院通过 ParallelEye 建立虚拟北京
英特尔公司发布“CARLA”3D 环境模拟器
谷歌照片：1 分 ; Clarifai Forevery：0 分
英伟达公司对将消费级显卡引入数据中心的做法说不
伯克利大学发布“Ray”训练软件
前美国军方高管指出，无论政策如何，致命性自主武器都将“悄然来临”
Facebook 公司设计 AI，负责对其它 AI 系统生成的数据进行标记，从而创建可用于更多 AI 系统训练的数据素材

更多干货内容请关注微信公众号“AI 前线”，（ID：ai-front）

微信广东试点“微信身份证”

微信在广东试点“微信身份证”，居民只需刷脸即可开通这一功能，可用于住酒店、政务、车票等业务。由广州市公安局南沙区分局、腾讯、建设银行等 10 余家单位发起的“微警云联盟”在广州南沙成立，并签发全国首张微信身份证“网证”。目前，微信身份证“网证”在广东省试点试行，预计明年 1 月推向全国，随时随地证明“我就是我”的问题。

百度 Apollo 全线产品将在 CES 展亮相

百度 Apollo 全线产品将首次在 2018 年 1 月 9 日至 12 日举行的第 51 届 CES（国际消费类电子产品展览会，International Consumer Electronics Show）上集体亮相，包括支持简单城市道路自动驾驶的 Apollo2.0、DuerOS 硬件产品，以及 Apollo 海外合作伙伴、传感器方案、参考车型，面向海外开发者和合作伙伴展现 Apollo 产品化、量产化成果。

柯洁“食言”：明年再战 AI

近日，柯洁坦承他将“食言”，在明年 4 月份复出，再战 AI。他将于 2018 年 4 月在广州举行的第一届“吴清源杯”世界女子围棋赛暨 2018 年世界人工智能围棋大赛上，与来自创业公司天壤智能的“天壤”对战，参与大赛的还包括腾讯绝艺、日本的 DeepZenGo、台北的 CGI 等 AI。

以下新闻均来自 Import.AI，内容翻译疑惑的独家授权，未经许可，禁止转载！

综合性城市及其意义：通过 ParallelEye 建立虚拟北京

随着人工智能正由数据竞争时代走向环境竞争时代，研究人员们试图借此探讨如何更好地收集真实世界中的数据…

北京中国科学院复杂系统管理与控制国家重点实验室的研究人员们已经发布了“ParallelEye”数据集的详细信息——这是一套以北京中关村地区为蓝本的三维城市环境数据集合。他们通过抓取 2 公里 x 3 公里区域内的可用开放街道地图（简称 OSM）布局数据来构建此套数据集，而后利用 CityEngine 进行数据建模，最终立足 Unity3D 引擎完成整体环境构建。

与其它大规模 3D 环境设计工作相比——例如 UofT/ 优步通过程序性城市生成工具用于创建多伦多 3D 地图的半自主数据增强技术，北京市的方案在人为参与度方面似乎太高。不过作为优势，其不需要使用昂贵的传感器及 / 或卫星，而是提供一种相对而言劳动密集度更高的方法进行真实世界数据提取与收集。如果这种方法能够建立起理想的数据集，那么未来研究人员们将可能利用深度学习方法设计自动化管道，例如由 OSM 地图到完整 Unity3D 模型的转换。

研究人员们对 ParallelEye 进行了一系列基本测试，即将合成摄像头安装在自动驾驶车辆或者大型监管系统之上以测试其实际可用性。不过他们并没有开展实际 AI 技术层面的尝试，而是打算将这部分空间留给之后的研究工作。

扩展阅读: ParallelEye 数据集：为交通视觉研究构建大型人造场景 (Arxiv)

https://arxiv.org/abs/1712.08394

英特尔公司发布“CARLA”3D 环境模拟器：

据称，目前任何财力足够雄厚的企业都热衷于拥有属于自己的至少一套定制化 AI 模拟器。至于具体原因？呃，谁知道呢…

英特尔公司最近发布了其用于对 AI 系统（例如自动驾驶车辆 AI）进行测试与评估的 3D 模拟器 CARLA 的代码。

英特尔公司写道，“CARLA 是一款用于自动驾驶研究的开源模拟器。自立项以来，CARLA 的作用一直是用于支持自动市区驾驶系统的开发、训练与验证工作。”

目前的人工智能环境不禁让人联想到几年之前的编程语言世界，或者更早的由超级计算机供应商们建立起的动荡而太大的生态体系。毫无疑问，目前我们正身处一股革命性技术实验的初始阶段，大家能够随时尝试各类思路，而真正的赢家要到几年之后才会确定下来。人工智能编程框架目前正在经历自己的寒武纪大爆炸，特别是在 3D 环境领域——开发商们似乎正在努力将 TensorFlow 与 PyTorch 加以整合，此外 Caffe/Torch/CNTK/Keras/MXNet 等其它一些（可能存在互补关系）框架也都在努力争取自己的生存空间。

问题: 技术项目已经出现，能够帮助开发人员将构建于某一种框架之内的模型通过直接转移机制或者 ONNX 等元抽象手段转移至其它框架当中。那么除了分辨率约束条件与物理常数之外，3D 环境到底代表着什么？

扩展阅读: CARLA: 一款开放市区驾驶模拟器 (PDF 格式)。

http://proceedings.mlr.press/v78/dosovitskiy17a/dosovitskiy17a.pdf

扩展阅读: CARLA 0.7 版本发布说明。

https://github.com/carla-simulator/carla/releases/tag/0.7.0

谷歌照片：1 分 ; Clarifai Forevery：0 分

对照片内容进行分类似乎成为云计算时代下初创企业们所面临的一个风险巨大的命题。

图像识别初创企业 Clarifai 公司正着手关闭其面向消费者的移动应用 Forevery，转而将业务重心放在自家图像识别服务与相关 SDK 身上。就目前来看，谷歌与苹果这类大型企业将能够借助自身大规模机器学习类产品压倒初创公司。考虑到各大技术巨头的雄厚实力，初创企业们恐怕将只能挣扎求存。

扩展阅读: 再见，Forevery。你好，未来。(博客)。

https://blog.clarifai.com/goodbye-forevery-hello-future/

英伟达公司对将消费级显卡引入数据中心的做法说不：

英伟达公司调整了自身许可条款，旨在阻止用户在数据中心环境内使用其价格更为低廉的消费级显卡产品。

最近几年以来，英伟达公司一直是 AI 计算领域无可争议的王者。事实上，开发人员们正纷纷利用其显卡训练神经网络，这主要是由于英伟达方面一直利用 CUDA/cuDNN 等工具对科学 /AI 计算提供重要支持。

在过去几年当中，英伟达公司一直在以昂贵的售价为数据中心客户提供昂贵的专用型显卡设计方案，但开发者们则认为这些包含有可靠性保障与纠错能力等企业级功能的显卡仅仅是为了帮助英伟达向客户收取更高的费用。事实上，由于众多开发者更倾向在接受较高故障率的前提下利用价格更加低廉的消费级显卡充实其数据中心，从而获取更理想的每美元 FLOPS 性价比，因此专业级显卡的市场消费量一直不尽如人意。

为了解决这个问题，英伟达公司已经从呼吁转向威逼——即硬性要求开发者们改变其购买习惯：英伟达公司于上周在采访中证实，其最近刚刚调整了用户协议，旨在借此帮助自身从部分大客户处获取更高利润。

英伟达公司在一份声明中解释称，“我们最近在 GeForce 专用 EULA 当中添加了一项新的规定，以防止我们的 GeForce 与 TITAN 产品在苛刻的大型企业环境当中遭到滥用。我们意识到，研究人员们会经常将 GeFOrce 及 TITAN 产品用于非商业用途或者其它非数据中心规模的研究用途，英伟达不会禁止这类使用方式。”

扩展阅读：英伟达公司声明全文。

https://www.cnbc.com/amp/2017/12/27/nvidia-limits-data-center-uses-for-geforce-titan-gpus.html?__twitter_impression=trueTITAN

显卡溢价问题: 即使是在英伟达自家的桌面级显卡范围之内，不同显卡之间的性价比水平也存在着巨大差异，下文即对 1080 与 TITAN V 作出了比较。

扩展阅读: Titan V 对 1080 Ti — 单挑决胜负。TITAN V 在 CNN 计算领域是否物有所值？110 TFLOPS！无脑买买买！

https://medium.com/@u39kun/titan-v-vs-1080-ti-head-to-head-battle-of-the-best-desktop-gpus-on-cnns-d55a19866b7c

伯克利大学发布“Ray”训练软件：

研究人员们对强化学习编程进行了重构，旨在获取更出色的性能表现与规模化水平。

伯克利大学的研究人员们公布了 Ray RLLib 软件，旨在帮助使用者更轻松地构建并运行强化学习实验方案。包括 Spark 数据处理引擎缔造者在内的各位研究人员解释称，强化学习算法比典型的 AI 模型（主要通过监督式学习进行分类模型训练）要复杂一些，这意味着需要在进行框架设计时对强化学习中使用的部分常规基础组件进行数值优化。研究人员们写道，“RLLib 希望利用基于任务的编程模型允许各组件自行控制对应的资源与并发度，从而显然简化各组件的组装与复用。”

研究人员们进一步补充称，“与深度学习框架中的传统运算符不同，各独立组件可能需要实现跨集群的并发性，使用由深度学习框架所定义的神经网络，以递归方式发布对其它组件的调用或者面向第三方黑盒模拟器的接口。与此同时，用于连接这些组件的主算法会快速演进，并在不同层面中带来更多并发机会。最后，强化学习算法需要处理大量状态（例如重播缓冲区与模型参数），这些状态必须立足多种并发层级及不同物理设备实现管理。”

研究人员们通过对一系列强化学习主要算法（例如近邻策略优化、进化策略等）进行重新实现的方式进行 RLLib 测试。此外，他们还在尝试重新实现整体系统——例如 AlphaGo。

再有，他们还在这套框架之内设计出更多新的算法：“我们尝试实现一种新的强化学习算法，其在 ES 优化流程的内部循环中运行 PPO 更新，从而实现 PPO 模型的随机扰动。我们得以在一小时之内即将其部署至一套小型集群内并进行评估。其实现仅需要约 50 行代码，且无需对 PPO 作出任何修改，这体现出了其重要的封装价值。”

扩展阅读: Ray RLLib (说明文档)。

http://ray.readthedocs.io/en/latest/rllib.html

扩展阅读: Ray RLLib: 一套可组合且可扩展的强化学习库 (Arxiv)。https://arxiv.org/abs/1712.09381

前美国军方高管指出，无论政策如何，致命性自主武器都将“悄然来临”：

曾效力于美国国家侦察办公室的前空军少将 Robert Latiff 表达了其对于人工智能技术的担忧与观点。

根据前美国国家侦察局官员 Robert Latiff 的说法，人工智能技术将给战争带来革命性的变化。而且已经有诸多迹象表明，美国在这一领域的技术领先地位正有所缩小。此外，这些技术的出现也将给人们在战争当中所应遵循的道德原则带来新的挑战。

他在接受彭博社的采访时解释称，“我认为人工智能与自主技术的崛起可能引发诸多问题，这是因为其缺少人类的参与。因此对于极端势力而言，他们所关注的仅仅是‘正确的意图’——但杀戮行为背后是否存在着正确的意图？他们是否有权这样做？我们是否真的在保护无辜生命？我们要采取哪些举措来防止不必要的痛苦？在自主技术与人工智能层面，我认为即使单纯从业务角度出发，也没有任何人能够证明这些系统的所作所为皆具备有力的理由。”

“美国国防部目前正在采取的自主性举措令我感到担忧。更具体地解释：他们曾在 2012 年出台一项政策，要求整个处理流程中必须有人类参与。这一点值得肯定。我非常反对在致命武器当中引入完全自主运作机制。然而与大多数此类政策相悖的是，国防部从来没有在这方面实施任何指导，也从来没有推进过任何后续行动。最近国防科学委员会发布的报告当中，也没有提到任何与自主性致命武器相关的建议。总而言之，他们对这类议题一直保持着缄默。坦率地讲，我认为这主要是由于任何发言都会让人们意识到自主机制已经悄然来到我们的身边，而且无论是否同意，这样的情况终将发生。我认为这是种自欺欺人的作法，并呼吁政府当局应该就自主性致命武器的管理政策予以澄清。”

扩展阅读: 我们还没有做好应对杀戮机器人的准备（彭博社）。

https://www.bloomberg.com/view/articles/2017-12-30/nobody-s-ready-for-the-killer-robot

Faceboo k公司设计 AI，负责对其他 AI 系统生成的数据进行标记，从而创建可用于更多 AI 系统训练的数据素材：

…准确度几乎不会受到影响，但成本可降低 95%…

人工智能研究人员所面临的一大关键性问题在于，如果需要收集特定类型的数据，他们就必须弄清如何进行训练并组织大批人手对大量数据进行手动标记。这项工作可能带来高昂的成本支出，特别是考虑到 AI 研究人员所面对的数据集规模正在不断扩大。

为了解决这个问题，Facebook 公司与麻省理工学院的研究人员们编译并发布了 SLAC——这是一套利用 AI 技术对数据集进行自动化标记的方案。SLAC 当中包含 200 多种操作类别（提取自 ActiveityNet-v1.3 数据集），涵盖 52 段视频以及超过 175 万条独立注释。SLAC 为研究人员们提供了更理想的、可用于算法训练及评估的素材。这些算法将能够查看个别图像帧，并标记出现在其中的时间动作——这是智能 AI 系统在复杂环境当中进行实际部署时所必需的真实环境感知能力，特别是在汽车、机器人与监控系统等场景之下。

数据自动化: 研究人员们通过下列方式对大部分数据收集工作进行自动化处理：他们首先尝试去除视频剪辑当中存在的常见缺陷（例如利用基于 R-CNN 的图像分类器来查找不包含任何人类对象的视频，并将其删除）。接下来，他们利用基于人类反馈的标签系统，旨在向人类注释者呈现无法通过人工智能系统实现高自信度标记的视频内容。从功能层面来讲，其更像是一套完整且复杂的监督型数据训练计划，SLAC 能够始终确定哪些内容最不具确定性，并将这些片段提供给人类研究人员。

节约时间: 最终，Facebook 公司得出结论，通过人工加自动化引导的方法，SLAC 数据的处理时间大约为 4390 个小时。而如果不引入任何自动化机制，那么整个实验过程将需要 11 万 3200 个小时。

结果: 在数据预训练方面，SLAC 在预训练数据集的处理效果方面优于 Kinetics 以及 Sports-1M 等动作认知模型。另外，其在处理迁移学习类任务时同样拥有上佳表现。

扩展阅读: SLAC: 一套用于动作分别与定位的稀疏标记数据集 (Arxiv)。https://arxiv.org/abs/1712.09374

技术故事:

[2030 年：美国，东海岸。]

756 号之前从没在建筑工地上工作过，所以今天对它来说是个重要的日子。一个人类站在一台巨大的黄色机器前面，缄默无言地操作手中的平板电脑，直到 756 号下载到其当天、当周以及当月的工作目标——外加一系列额外的情境信息，用于处理特定视觉纹理、扬尘模式以及振动趋向的现场特定数据。

整个建筑工地运行的是最新版本的 ArchCollab，因此 756 号需要在完成自身任务的同时，确保将其整合至与其它机器进行交互的现场大型“跨模式社交结构”当中。

756 号获取到内部 GO 代码，根据地面上由红色与白色交叉符号组成的“无人指示”标记前进至指定楼层，并放飞一组用于观察及分析的增强型无人机。其它机器人也没有停止自己手头的工作——因此除了在共享 ArchCollab 软件当中运行的元计划程序指示之外，756 号必须独力完成任务。为了提高工作成效并快速获取新的技能，756 号需要证明自己作为机器人的工作能力。因此随着时间推移，756 号开始积极融入到工作当中——例如找到合适的时机伸出液压臂举起一条大梁、进行焊接操作或者简单清理现场周边的垃圾。在完成相关工作后，其它机器人注意到 756 号的工作能力评分略有上升。

一天的工作即将接近尾声。运输机器人 325 号在从一座铁塔的中央核心处运送金属梁时发生误操作，该根金属梁不慎滑出并快速下落。无人机已经来不及进行回收，而 756 号的位置与预计落地位置非常接近。为了应对这起突如其来的事故，756 号伸出一条机械手臂，利用其闪电般的 AI 反应能力抓住了飞行中的大梁。

没有掌握，也没有欢呼——其它机器人以沉默面对这次英勇的举动。但别担心，756 号因为这次出色的表现而迎来更高的工作能力评分，这将允许其收集更多数据与经验，并凭借更高的技能水平进一步提升工作水平。

在一个星期之后，为数不多的几位人类监督员在网站上回顾了现场工作录像，并发现机器人们开始大规模采取丢落方式运送建材——而不再慢慢等等升降机的到来。一年之后，ArchCollab 开发出一款特殊的“抓取与放下”模块，使得其它建筑工地的机器人也能实现同样的操作。两年之后，一家德国公司设计出一套定制化抓斗。与此同时，机器人厂商还开发出一款具备极高抗拉强度与灵活性的手臂。在设备推出之后，建筑工地上很快响起此起彼伏的建材呼啸之声——没错，这意味着新的运输模式就此诞生！

故事中的技术方案: 机械、无人机 - 机器人协作、目标功能、机器人、社交信用评分系统。

作者 Jack Clark 有话对 AI 前线的读者说：我们对中国的无人机研究非常感兴趣，如果您想要在我们的周报里看到更多有趣的内容，请发送邮件至：jack@jack-clark.net。

原文链接:

https://jack-clark.net/

注意：由于微信不支持外链，文章中链接可点击