AI前线一周新闻盘点：歌手Justin Timberlake也来炒深度学习，Facebook发布免费语音识别工具包

2018 年 1 月 11 日 AI前线

作者｜Jack Clark

译者｜核子可乐

编辑｜Emily

AI 前线导读：近日，一篇预测 2018 年 AI 技术趋势的文章吸引了 AI 前线的注意，文中讨论了如何将 2017 年业界已经酝酿出一些成熟产物在在 2018 年实现大规模应用。在 2018 年，开发者如何将一系列 AI 技术成果应用于当前的工作当中呢？AI 前线对这篇文章做了部分翻译，供大家参考。

更多干货内容请关注微信公众号“AI 前线”，（ID：ai-front）

内容导读：一周一度的盘点新鲜出炉，各位看官接好了~

Facebook 公司发布免费语音识别工具包 wavletter
我们何时才能将“Prime Air”推向军用？
通过新的“SenseNet”模拟器实现形状学习
新环境：利用 2D 迷宫提升 AI 能力
技术人员为何需要努力投身政府的 AI 政策制定工作
预测不可预测之事：Miles Brundage 的 AI 预测

更多干货内容请关注微信公众号“AI 前线”，（ID：ai-front）

以下新闻均来自 Import.AI，内容翻译获得独家授权，未经许可，禁止转载！

Facebook 发布免费语音识别工具包 wavletter

……同时提供经过预先训练的 Librispeech 模型形式以供推理，堪称 Facebook 发给 AI 技术社区的“大红包”……

Facebook 公司已经正式公布开源自动语音识别软件 wav2letter。在此之前，Facebook AI 研究团队已经通过两篇论文对此项技术作出陈述，但其代码一直没有正式亮相。（两篇论文分别为《Wav2Letter: 一套基于卷积网络的端到端语音识别系统》

https://arxiv.org/abs/1609.03193

以及《利用门控卷积网络实现基于字母的语音识别》

https://arxiv.org/abs/1712.09444）。

此次发布的版本中包含多套预先训练完成的模型。我认为这些成果属于 Facebook 公司向整体 AI 社区支付的“研究与计算红包”（当然，如果学术实验室能够拥有类似的大规模资源以推进自身研究与后续发布，那结果无疑更值得期待）。

– 扩展阅读: : wav2letter (GitHub)。

https://github.com/facebookresearch/wav2letter

我们何时才能将“Prime Air”推向军用？

…无人机送货当中的商业创新成果将给军事行动带来哪些影响…

鉴于技术的快速发展，很多朋友可能怀疑军方将很快在其整体供应链当中使用无人机设备。那么，为什么这种猜想仍没有变成现实？在美国空军官员 Jobie Turner 撰写的文章当中，其讨论了美国如何使用这项技术，为何仍需要很长时间才能将其实际部署至军事体系当中（‘商业市场上出现的任何新型物流技术，都不需要应对战时必须有能力解决的种种前提性条件’），以及如何利用由此实现的快速后勤能力影响军事行动。

Turner 同时指出，“速度与容量往往并不是美国物流体系所面临的主要障碍。事实上，太多太快所引发的问题反而比太少太迟更为严重。举例来说，在瓜达尔卡纳尔岛行动当中，美国海军陆战队员们登陆时曾在海滩上旋转了大量食物与设备，但却发现其缺乏充足的人力及机械将这些物资运出海滩。结果，海浪的冲击卷走了本可维持部队数周生存的食品，导致供应形势不断恶化。最近发生的另一个实例是在‘沙漠风暴’行动期间，大量货物以空运及海运形式进行输送，由此堆积而成的‘铁山’再次证明大部分货物永远无法抵达其预定地点。”

– 扩展阅读: 《布朗之盒的诱惑》(The Strategy Bridge)。

https://thestrategybridge.org/the-bridge/2017/8/30/the-temptations-of-the-brown-box?rq=Brown%20box

通过新的“SenseNet”模拟器实现形状学习

…模拟器与基准方案旨在激励从业者以超越传统视觉范式的途径，考虑如何进一步推动强化学习的发展…时至今日，大多数 AI 研究都围绕着对音频或视觉输入内容进行分类。那么触觉凭什么受到冷落？考虑到这一点，Jason Toy 于上周发布了一款新的 3D 环境模拟器加数据集——这就是“SenseNet”。

首先请大家闭上眼睛，想象您伸手拿起身边的瓷杯或者其它距离最近的物体。相信大多数朋友会意识到，您首先会在心中建立起触摸这些物体所带来的内在心理印象，而且这种印象与该物体的观感可谓截然不同。这样的触感思维正是 SenseNet 的灵感来源——其希望能够挑战我们原有的设计算法，从而让机器通过非视觉 3D 感测方式进行物体分类，最好还能配合视觉输入信息以进行成效强化。

SenseNet 为研究人员提供一个模拟“MPL”机械手，其中集成有用于模拟触觉的物理传感器。在它的帮助下，研究人员将能够尝试利用算法学习如何通过触摸（而非视觉外观）进行对象分类。其利用一个简单的 API 来模拟 OpoenAI Gym——开发人员对此应该并不陌生。

– 扩展阅读: SenseNet: 3D 对象数据库与触觉模拟器 (Arxiv)。

https://arxiv.org/abs/1801.00361

新环境：利用 2D 迷宫提升 AI 能力

…这个开源项目允许您训练代理以解决各种不同迷宫，其中部分迷宫方案已经被用于认知神经科学实验…

您有没有设想过打造一套能够无限延伸的程序化迷宫，利用其测试您的智能开发成果并期待自己的方案能够找出独特的前进道路？如果答案是肯定的（或者您至少对训练 AI 代理的研究抱有兴趣），那么 Gym-maze 可能正适合您。该软件项目由 Xingdong Zuo 建立，提供一套定制化环境以测试 AI 代理，并可作为 OpenAI Gym 的运作环境。其中还附加一款迷宫生成器、出色的记录界面，外加 Jupyter 记事本——您可以利用其建立一大堆不同类型的迷宫及其对应的可视化成果。

关注 AI 神经科学议题的朋友可能会对其中的莫里斯水迷宫感兴趣——这是一种常被用于测试啮齿类动物认知能力的环境。（DeepMind 及其它机构也曾利用莫里斯水迷宫对某些代理进行测试。）

附加奖励: 其还提供一套出色的文档式 A* 搜索方案，可用于验证程序生成的迷宫。

– Gym-maze 代码 (GitHub) 地址：

https://github.com/zuoxingdong/gym-maze

一周 AI 音乐视频

…新的 Justin Timberlake 视频功能机器人、学者、未来派节拍以及深度学习等。另外，报告称“快速质变”的说法并不准确…

2017 年：AI 研究人员在 Yves Saint Laurent 宣传活动中成为时尚模特。

2018 年：Justin Timberlake 发布一卷名为《Filthy》的最新音乐录影带，其内容将时间设定在 2028 年，主要表现在马来西亚吉隆坡举办的“泛亚洲深度学习大会”。不过出席此次深度学习大会的机器人将在这里比拼舞技（我认为他们设置的 2028 年这一时间节点似乎有些过于乐观）。警告：这段视频中存在一些令人不快的性别主义与物化倾向，但这确实是一种合理的发展推测。

– 视频地址: Justin Timberlake, Filthy (YouTube, 不太适合上班时观看)。

https://www.youtube.com/watch?v=gA-NDZb29I4&feature=youtu.be

技术人员为何需要努力投身政府的 AI 政策制定工作

…安全专家 Bruce Schneier 在评论中表示，目前的规则还不足以推动机器人迎来光明的未来…

在《纽约杂志》的一篇专栏文章中，Schneier 表示政府还没有准备好应对全球数字化趋势所带来的政策性挑战。

他指出，“本世纪几乎所有的主要政策讨论中都将技术作为一大重要组成部分。无论是大规模杀伤性武器、机器人对于就业的巨大影响、气候变化、食品安全还是不断增长且老天的无人机设备，理解政策本身就意味着理解技术。我们的社会迫切需要将技术与政策结合起来。否则，我们得到的只可能是糟糕的政策方针。”

Schneier 建议称，政府应建立新的机构来研究这一广泛的话题——即“技术政策部门”，这一概念属于 Ryan Calo 所提出的“联邦机器人委员会”方案的加强与扩展版本。就文章本身来看，尚不清楚其与白宫目前的科学与技术政策办公室有何区别。（当前，白宫科学与技术政策办公室同样存在人力不足现象，其中缺少与人工智能相关的公开资料，亦未在这方面作出任何重大的声明或者政策性公告——这一点与其它国家相比明显处于落后地位。）

令人有些沮丧的政策评论: 考虑到政府普遍对科学性开支抱有怀疑态度的背景，相较于建立全新机构，要求政府各个部门立足现行法律或者通过现有立法机构对人工智能问题作出解释似乎要更为简单可行。

扩展阅读: 点击此处杀死所有人 (纽约杂志 – 节选 / 全文)。

http://nymag.com/selectall/2017/01/the-internet-of-things-dangerous-future-bruce-schneier.html

扩展阅读: 联邦机器人委员会提案，Ryan Calo (Brookings)。

https://www.brookings.edu/research/the-case-for-a-federal-robotics-commission/

预测不可预测之事：Miles Brundage 的 AI 预测

…Arxiv 论文关注者兼 AI 政策研究员对他本人的 2017 年预测结论作出回顾…

Miles Brundage 通过一篇详细的博文对其面向 2017 年作出的 AI 发展预测进行了回顾。预测人工智能的发展无疑是一项重要挑战，而且审视 Miles 当初给出的具体且谨慎的预测也确实非常有趣。不过立足 2018 年，我们发现其中一些仍然缺少确切的答案，这意味着有必要对问题加以进一步调整。我们发现这种元分析对于我们自己的人工智能构思很有帮助，在这里要感谢 Miles 及其他合作者。

要点: Miles 的雅达利预测在计算需求层面的结论值得关注，不过他的预测在涉及具体应用（例如〈星际争霸〉与语音识别）以及其它开放性研究领域（例如迁移学习）时则显得有些模糊。

扩展阅读: Miles Brundage 2017 年 AI 发展预测回顾。

http://www.milesbrundage.com/blog-posts/review-of-my-2017-forecasts

扩展阅读: Miles 2017 年 AI 发展预测原始内容。

http://www.milesbrundage.com/blog-posts/my-ai-forecasts-past-present-and-future-main-post

OpenAI/Misc 摘要

来自 NIPS 2017 的政策研讨：

人工智能会议上的前沿研究讨论会对政策产生怎样的影响？Tim Hwang（曾效力于谷歌，目前领导哈佛 - 麻省理工学院人工智能项目道德与治理工作）试图在目前的研究当中找到其中的端倪。

扩展阅读 : NIPS 2017 政策现场说明。

https://medium.com/@timhwang/nips-2017-policy-field-notes-55176da092d1

技术故事

[2XXX 年，后 AGI 时代下一家宠物店中]

. 会飞的汽车、部分戴森球、明信片大小的超级计算机已经陆续成为现实，众多针对性且复杂的惩罚措施出台，机器开始编写法律并参与投票，高维 AI 兴起且仅通过数学猜想作为接口与人类及其它 AI 对接，甚至连母鸡产下的蛋都总会裂成完美的两半。

但真正令人惊奇的事物仍存在于其它更普通的地方，比如面前这家宠物店。很明显，现在我们可以模拟大家喜爱的任何宠物，而且大多数孩子都会伴随身边一只会说话的猫或狗共同成长。事实上，我们大多数人都把时间花在模拟——而非真实的物理对象身上。当然，一部分人仍然坚信“真实事物”的重要性。真正的动物、真正的人、真正的交互、真正的酒。虽然我们无法在体验及效果层面对二者加以区分，但这种若有若无的“真实感”总会让人更安心——这可能是几十亿年来星系间作用的终极产物，谁知道呢。反正人们就是喜欢真东西，包括我自己在内。

因此，我一只手捧着装有小猫遗体的低温箱，另一只手拿着一台数据设备在同店内的经营机器人交涉。这可以算是一场谈判，它能在未来几年内持续追踪我的部分数据，而作为回报它得扫描小猫、重新构建并将其思维下载到另一只年轻的小猫身体当中。好家伙，托比先生一下子成了小托比先生，并需要重新经历一次成长过程。但这一次它会变得更聪明，也更有个性。这对我来说也是件好事，毕竟我和托比先生已经很有感情，看到它拥有新的身体也让我感到欣慰不已。

不过还有个问题，因为我之前提到了托比先生的“遗体”，其实这种说法并不准确，因为当时它还活着。更准确的说法应该是“即将死去”。我的兽医 AI 今早告诉我，19 岁的托比先生只剩下 0 到 200 天的寿命周期，具体概率分布未知。坦白地讲，我很惊讶托比先生竟然能坚持到现在。

因此我做出了当今人们所习惯的选择。我把它放进低温箱中，同时搭飞行汽车前往宠物店。在谈判完成之后，我只需要打开盒子让托比先生摆脱休眠状态，接下来就是实施安乐死并进行思维数字化转移——很有效，但却莫名有种冷酷的意味。

事实上，我现在就可以放下盒子转身离去。但我觉得这事并不像说起来那么轻松，毕竟之前提到过，一部分人仍然很重视真实的事物——当然也包括真实的死亡。因此，托比先生在技术层面讲可能已经死了，也可能还活着，我不知道。

故事中的技术来源: 大脑模拟、Robin Hanson 的埃姆时代、Schrodinger 的悖论，还有朋友养的这只睡在我胳膊上的小猫。

作者 Jack Clark 有话对 AI 前线的读者说：我们对中国的无人机研究非常感兴趣，如果您想要在我们的周报里看到更多有趣的内容，请发送邮件至：jack@jack-clark.net。

原文链接:

https://jack-clark.net/