AI一周热闻: 特斯拉或将退市;腾讯云致数据丢失事件发酵;GE华人工程师被捕

2018 年 8 月 8 日 AI前线
作者 | Jack Clark
编译 | Debra
编辑 | Vincent
AI 前线导读:

- 马斯克发推表示特斯拉或将退市

- 腾讯云客户“数据丢失事件”发酵,赔偿方案遭拒

- OpenAI 在 DOTA 5v5 中完胜人类职业玩家

- 小鹏汽车完成 40 亿元融资,估值近 250 亿元

- GE 华人工程师被捕,涉嫌盗窃 GE 商业机密

- 谷歌发布 Android 9 Pie,结合 AI

- 特斯拉自研 AI 芯片,将用于自家车辆

- 腾讯用 1000+GPU 打破 ImageNet 训练记录

- 牛津 RobotCar 数据集更新超精细版

- 全新天气数据集 RFS 面世

- DeepMind 实现神经算术逻辑单元,教会计算机计数

- 谷歌发明手机端神经架构搜索方法优化 AI 模型

更多优质内容请关注微信公众号“AI 前线”(ID:ai-front)
马斯克发推表示特斯拉或将退市

8 月 8 日,特斯拉 CEO Elon Mask 发推,表示正在考虑使特斯拉以每股 420 美元的价格退市,并表示资金安全。他还希望所有投资者留下,他将创建专项基金。股东可以以 420 美元的价格抛售股票,也可以选择继续作为将变成私人企业的特斯拉的股东。



如果退市成功,这将是有史以来最大规模退市交易,按每股 420 美元计算,意味着特斯拉退市交易规模高达 720 亿美元。马斯克没有披露资金来源。

在发送给员工的一封信函中,马斯克解释称,让特斯拉退市还尚未做出正式决定,将使公司“以最好的状态运行,不会受到如此大的干扰和短期思维的影响”。

今年以来,马斯克面临多方压力,主要在于他做出的特斯拉转亏为盈、产量的承诺。在马斯克和特斯拉面临诸多挑战之际,退市是避开公开市场严格监管的一个途径。

腾讯云客户“数据丢失事件”发酵,赔偿方案遭拒

8 月 5 日,北京清博数控科技有限公司所属“前沿数控技术新媒体”发微博称,在使用腾讯云 8 个月后,公司存储在腾讯云上的数据无可挽回地丢失。

据悉,这是受腾讯云北京三区部分物理硬盘固件版本 bug 导致的静默错误(写入数据和读取出来的不一致)影响,文件系统元数据损坏。经组织技术专家尝试修复数据,最终仍有部分数据完整性校验失败。

8 月 2 日,腾讯云向“前沿数控”说明情况并表达歉意,并提出 136469 元“赔偿 + 补偿”方案,但是遭到后者拒绝。同时,后者对腾讯云“99.9999999% 数据可靠性,搭载了云硬盘三副本存储策略”非常存疑,认为有夸大之嫌。

目前,双方还未就赔偿方案达成一致,事件仍在发酵中。

OpenAI 在 DOTA 5v5 中完胜人类职业玩家

8 月 6 日凌晨,OpenAI Five 对阵 5 名高级玩家(解说员 + 前职业玩家)——Blitz, Cap, Fogged, Merlini 和 Moonmeander,以 2:1 战胜人类职业玩家。这五名职业玩家的平均天梯分 6000 以上。

去年,OpenAI 在 DOTA 1v1 单人赛中击败了世界上最好的职业选手之一 Dendi;今年 7 月,在特定规则下 5v5 团队常规比赛中又击败了业余队伍(天梯水平约为 4000)。

根据公开资料,OpenAI Five 的实力相当于人类玩了 180 年的游戏,而且每天都与自己进行对抗学习,学习过程非常复杂,需要在 256 个 GPU 和 128,000 个 CPU 上运行扩展版本的近端策略优化(PPO)进行训练。

小鹏汽车完成 40 亿元融资,估值近 250 亿元

8 月 2 日,小鹏汽车正式宣布完成 B+ 轮融资,此轮融资总额为 40 亿元人民币,由春华资本、晨兴资本及小鹏汽车董事长兼 CEO 何小鹏领投,高瓴资本、K11、钟鼎创投也参与了此轮投资。

此次融资结束后,小鹏汽车整个 B 轮融资达到 62 亿人民币,累计融资额已超过 100 亿人民币,现估值近 250 亿人民币。

据悉,这是 2018 年迄今以来,新势力造车中最大的单轮融资。

2017 年 5 月,小鹏汽车 A 轮获得了由神州优车公司发起成立的优车产业基金领投 22 亿元融资,同年 12 月,完成 A0、A1、A2 三轮融资。今年 1 月 29 日,小鹏汽车宣布启动 22 亿的 B 轮融资,由阿里巴巴、富士康、IDG 联合领投。

GE 华人工程师被捕,涉嫌盗窃 GE 商业机密

据《华尔街日报》报道,国家“千人计划”专家、通用电气主任工程师郑小清被 FBI 逮捕,他被指控涉嫌窃取蒸汽涡轮制造流程图等技术机密送回中国。

这是继华人工程师张晓浪涉嫌盗取苹果无人驾驶技术机密被 FBI 逮捕事件后,又一起华人工程师被 FBI 逮捕事件。

根据纽约北区联邦法庭的起诉书,FBI 称郑小清把 39 份通用公司的设计与流程图纸加密打包,然后放到一张照片文件的代码后面,将其伪装成一张正常的日落风景图,从公司服务器上拷贝出来,发到自己的邮箱里面。如果罪名成立,郑小清将面临十年监禁和 25 万元罚款。

谷歌发布 Android 9 Pie,结合 AI

8 月 7 日,谷歌正式向全球发布 Android 9 Pie。此次更新版本的手机主要强调与人工智能的结合,加入的新功能将俄昂手机更了解用户的习惯,并利用这些信息来提高安卓体验。

Android Pie 于 8 月 7 日面向 Pixel 用户推出,但其他用户需等待一段时间,谷歌表示希望是在今年,但具体信息并未透露。

据悉,此次更新的新功能包括“自适应亮度”和“自适应电池”,它们将利用以往的使用信息,适时地降低设备的亮度,并减少不常用 APP 使用的电量。另外,新功能还包括基于 AI 且在后台运行的预测工具,为用户预计使用的下一个应用程序提供建议的 App Actions、全新应用导航系统、文本放大镜、beta 版仪表板 Digital Happiness 等。

特斯拉自研 AI 芯片出炉将用于自家车辆

据外媒报道,Elon Musk 在上周三的电话会议上表示,特斯拉正在自主研发自动驾驶 AI 芯片,基于该芯片的新自动驾驶技术未来将会被运用到 Model 3、Model X 和 Model S 的 Autopilot 自动驾驶系统之中。

Elon Musk 表示,新的芯片将比当前特斯拉目前使用的英伟 GPU 快一个数量级,英伟达的芯片每秒可处理 200 帧视频,而特斯拉的芯片每秒可处理来自汽车周围的摄像头的 2000 帧视频,且仍有剩余容量用于数据冗余和提升安全保障。

事实上,特斯拉其实从至少两年前开始就已经在“悄悄”开发为自驾功能准备的定制 AI 芯片了。据 Tesla 总监 Pete Bannon 透露,新款 AI 芯片将会被整合入 Autopilot 硬件的第三轮更新,而且其目前已经进入路测的阶段了。

腾讯用 1000+GPU 打破 ImageNet 训练记录

随着监督学习技术变得更具经济价值,研究人员正在努力减少训练深度学习模型所需的时间,在给定的时间内进行更多的实验,从而提高研究效率,以及提高训练新模型解释新数据输入或现有数据分布变化的能力。其中,一个重要指标是将'ImageNet'数据集上的网络训练到 baseline 准确度所需的时间。现在,腾讯和香港浸会大学的研究人员已经成功使用 2048 个 GPU,一个 64k 批量来训练 ResNet- ImageNet 上的 50 个模型,在 6.6 分钟内达到最高精度——75.8%,而 AlexNet 在 4 分钟内的精度达到 58.7%。

研究人员开发了一种名为“Jizhi”的分布式深度学习训练系统,该系统使用包括随机数据流水线技术、混合全减在内的技术,一个包含模型和变量管理的训练模型,以及混合精确网络等优化(使用半精度训练来增加吞吐量)。作者说,对结果产生影响最大的因素之一是,他们能够使用 LARS(分层自适应速率缩放 https://arxiv.org/abs/1708.03888)在训练期间随机性地在 16 位和 32 位精度之间进行切换——他们进行了消融研究,发现没有经过 LARS 训练的版本获得 73.2%的最高准确度,而使用 LARS 训练的版本精确度为 76.2%。

模型架构调整:作者消除了偏差和批量标准化的权重衰减,并将批量标准化层添加到 AlexNet 中。

沟通策略:研究人员进行了一系列调整,以解决训练基础设施规模庞大而带来的问题,包括“张量融合”,这使得他们可以在运行全局规约步骤之前将多个小尺寸张量组合在一起; 分层全局规约(hierarchical all-reduce),将 GPU 组合在一起,并有选择地减小或扩大以提高效率;以及混合全局规约(hybrid All-reduce),并根据当时最有效的的方式在两种不同的实现之间进行切换。

因为深度学习本质上是一种经验学科,科学家不断进行实验、观察结果,并使用来之不易的经验重新配置超参数和架构,并重复这一过程,这时计算机有点类似于望远镜:有了更大的计算机,你可以看得越远,因为你能以比其他人更快地进行更大规模的实验循环。大型企业之间在大规模训练上的竞赛可能会探索出许多有趣的研究途径,但也有可能导致研究在“低计算”和“高计算”环境中分道扬镳,因此进一步加大学术界和工业界之间的鸿沟,产生很多问题。

阅读更多:高度可扩展的深度学习训练系统,在 4 分钟内完成 ImageNet 混合精度训练(https://arxiv.org/abs/1807.11205)。

牛津 RobotCar 数据集更新超精细版

那不勒斯费德里克二世大学和牛津布鲁克斯大学为牛津机器人汽车数据集(Oxford RobotCar)增加了更多标签,专门用于训练基于视觉的自动驾驶汽车策略。新的数据集称为 READ,或“道路事件和活动检测”(Road Event and Activity Detection)数据集,包含大量日产聆风上自动摄像头环绕英国牛津获取的约 11,000 帧数据。数据集标签包括“人类和所有道路使用者进行的时空活动,包括自行车、摩托车骑行者,车辆驾驶员和行人。”这种更丰富的数据集有助于开发更好的探测器,以创造更具适应性的自动驾驶车辆。

实验中,他们使用 Microsoft 的“可视对象标记工具”(VOTT)来注释数据集。这个版本的 READ 只是初步实验,科学家还计划最终标记 40,000 帧数据。而且,他们还有更雄心勃勃的计划,以创造一种新颖的深度学习方法来检测复杂的活动。

阅读更多:从机器人 - 汽车的角度进行动作检测(https://arxiv.org/abs/1807.11332)

全新天气数据集 RFS 面世

埃塞克斯大学和伯明翰大学的研究人员创建了一个名为 Rain Fog Snow(RFS)的新型天气数据集,可以用于更好地理解、分类和预测天气模式。

该数据集包含来自 Flickr、Pixabay、维基共享资源等网站的 3000 多张图像,描绘了不同天气条件下的场景图像,包括雨、雾、雪等天气。总的来说,研究人员从每个类中收集了 1100 张图像,作为实验数据集。

阅读更多:天气分类:新型多类数据集数据增强方法和卷积神经网络综合评估(https://arxiv.org/abs/1808.00588)。

DeepMind 实现神经算术逻辑单元,教会计算机计数

神经网络通常不太擅长数学。这是因为训练神经网络开发出可微分的数字表示是很困难的,通常大多数情况下需要依靠未经过学习的手动编程进行神经网络输出。现在,DeepMind 已经实现了几个专门用于教会计算机计数的模块——神经累加器(NAC)和神经算术逻辑单元(NALU)。作者写道,这些模块“偏向于学习系统的数值计算”。 “我们的策略是将数值表示为没有非线性的单个神经元。对于这些单值神经元,我们应用能够表示简单函数的运算符(例如,+, - ,x 等)。这些运算符由参数控制,这些参数确定用于创建每个输出的输入和操作”。

研究人员严格测试了他们的方法完成任务的情况,包括计算特定 MNIST 类的次数;基本的加法,乘法和除法任务;以及在更复杂的领域中进行测试和其他挑战,例如在模拟网格世界中完成任务时跟踪所需时间。

这样的系统有望扩大神经网络在更广泛问题中的适用性,并构建具有更大学习组件的系统,将人类的专业知识从数字处理器等手工编程转移到设计可以与系统其他部分一起学习的数字模块。

阅读更多:神经算术逻辑单元(https://arxiv.org/abs/1808.00508)。

获取代码:DeepMind 尚未发布官方代码,但这并没有阻止社区快速复制它的热情,目前在 GitHub 上有五种实现方式(https://twitter.com/iamtrask/status/1025846683274555393)。

谷歌发明手机端神经架构搜索方法优化 AI 模型

谷歌研究人员开发了一种针对移动电话进行调整的神经架构搜索方法 MnasNet,可以使用机器学习来学习设计可在移动设备上运行的神经网络架构。

MnasNet 将架构设计的任务视为“考虑 CNN 模型的准确性和推理延迟的多目标优化问题”。该系统使用被称为“分解的分层搜索空间”来挑选可能的架构设计。

结果显示,使用 MnasNet 训练的系统可以获得比通过其他自动机器学习系统方法训练的系统更高的准确度,其中一个变体获得 76.13%的最高图像 imagenet 准确度,比此前谷歌 NAS 技术 74.5%的精准度更高。研究人员还可以调整网络的延迟,因此系统地延迟为 65ms(在 Pixel 手机上评估),这在执行时间方面比其他方法更有效。

这样的方法使我们可以将成本昂贵的神经网络系统设计工作交给计算机来做,节省研究人员的计算时间。这意味着,越来越多的计算机将被用于自主设计系统,自动创建越来越优化的架构。值得注意的是,这样的方法将导致人工智能“富人更富”的结果,那些拥有更大计算机的人们能够设计出比竞争对手更具适应性、更高效的系统。

阅读更多:MnasNet:平台感知神经架构搜索移动(https://arxiv.org/abs/1807.11626)。

作者 Jack Clark 有话对 AI 前线读者说:我们对中国的无人机研究非常感兴趣,如果你想要在我们的周报里看到更多有趣的内容,请发送邮件至:jack@jack-clark.net。

原文链接:

https://jack-clark.net/2018/08/06/import-ai-106-tencent-breaks-imagenet-training-record-with-1000-gpus-augmenting-the-oxford-robotcar-dataset-and-pai-adds-more-members/

如果你喜欢这篇文章,或希望看到更多类似优质报道,记得给我留言和点赞哦!

登录查看更多
0

相关内容

腾讯云是腾讯公司倾力打造的面向广大企业和个人的公有云平台,提供云服务器、云数据库、云存储和CDN等基础云计算服务,以及提供游戏、视频、金融、微信、电商、O2O,旅游等行业解决方案。
斯坦福2020硬课《分布式算法与优化》
专知会员服务
120+阅读 · 2020年5月6日
【复旦大学-SP2020】NLP语言模型隐私泄漏风险
专知会员服务
25+阅读 · 2020年4月20日
【ICMR2020】持续健康状态接口事件检索
专知会员服务
18+阅读 · 2020年4月18日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
107+阅读 · 2020年1月2日
三安光电到底发生了什么?
商业人物
7+阅读 · 2019年1月28日
Arxiv
102+阅读 · 2020年3月4日
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
Arxiv
4+阅读 · 2018年11月6日
VIP会员
Top
微信扫码咨询专知VIP会员