幻影P
作者|Jack Clark
10 月 29 日,IBM 和 Red Hat(红帽)共同宣布,两家公司已达成最终协议,IBM 将收购 Red Hat 所有已发行和已发行的普通股,以每股 190.00 美元现金,总价值约 340 亿美元的价格正式收购后者。
收购完成后,Red Hat 将被并入 IBM 的混合云部门。
IBM 表示,通过此次收购,将继续致力于 Red Hat 的开放式治理、开源贡献、参与开源社区和开发模式,以及促进其广泛的开发人员生态系统。此外,通过专利承诺、GPL 合作承诺、开放发明网络和 LOT 网络等工作,IBM 和 Red Hat 将继续致力于持续的开源自由。
IBM 公司董事长,总裁兼首席执行官 Ginni Rometty 说:“收购 Red Hat 是一个改变游戏规则的方式。它改变了有关云市场的一切。” “IBM 将成为全球排名第一的混合云提供商,为企业提供唯一的开放云解决方案。”
与此同时,Red Hat 上个季度的销售总体上低于分析师的预期,而且本季度的预测也出现了下滑,财务数据增长放缓。截至被收购前,Red Hat 的股价在过去六个月内下跌了 28%。
最近,特斯拉自动驾驶有了新进展,推出自动驾驶功能 Navigate on Autopilot。
这一升级是特斯拉实现 L3 级自动驾驶的重要节点,也是兑现其完全自动驾驶承诺的新进展。新功能将启用特斯拉的全部传感器,包括八个摄像头、雷达和超声波传感器等。有了这一功能,特斯拉能够自动导航、自动驾驶前往指定位置,期间可以自动完成正常行驶、变换车道、通过路口等功能,进一步解放驾驶员。
随后,马斯克发布推特称自己已于上周卸任在特斯拉的所有职务。
继小米于 10 月 24 日发布全屏滑盖的 MIX 3 之后,华为于周五推出 Mate 20 系列,包括 Mate 20、Mate 20 Pro 等。
Mate 20 系列内置了华为最新麒麟 980 芯片,相比上一代麒麟 970,980 的 CPU 能效提升 58%、GPU 提升 178%、NPU 提升 182%。据余承东介绍,麒麟 980 芯片有 6 个业界第一加持:
全球最早商用 TSMC 7nm 工艺的手机 SoC 芯片
全球实现基于 ARM Cortex-A76 CPU 架构进行商业开发
首款搭载双核 NPU 的移动端芯片
首款搭载最新的 Mali-G76 GPU 架构的移动端芯片
通信方面率先支持 LTE Cat.21,峰值下载速率 1.4Gbps 达业内最高
内存方面支持全球最快的 LPDDR4X 颗粒,主频最高可达 2133MHz。
除了手机,华为还发布了一款手表 Watch GT 和一款儿童通话手表 3 Pro,以及华为首款智能音箱 AI Cube,正式进入智能音箱赛道。
近日,NIPS 董事会决定,否决 NIPS 改名的提案,维持原名不变。这一决定一出,引起学术界大佬联名抗议,由 Anima Anandkumar 发起、包括 Jeff Dean 在内近百人联名签署抗议信。
(Jeff Dean 发推表示抗议)
NIPS 的全称是 Neural Information Processing Systems(神经信息处理系统),这个缩略词对于英语使用者来说,包含性和种族的含义。在几次公众呼吁改名之后,NIPS 组委会在今年 4 月份宣布,他们正在考虑改名,向社区征询意见。
谷歌大脑研究员 David Ha(Twitter@hardmaru)还针对 NIPS 是否改名进行了一次投票,结果 50% 投票者认为保留原来的名字更好。
2018 年 10 月 22 日,NIPS 基金会董事会完成名称变更审议,最终决定会议名称不会改变,将继续关注多元化和包容性举措。
加利福尼亚大学最近开设了一门课程,教授学生设计、建造、变成自己的无人机。下面的论文简介介绍了课程机构以及如何创建一台现代无人机。
创建无人机分为四个阶段:设计 PCB,部署飞行控制器软件,组装 PCB 和试飞。该课程的好处在于关注得失学生的“犯错成本”,学生犯错越多,得到的分数越少,这会激励学生通过检测自主发现和改正问题。
在构建过程中,创建飞行器控制其软件是最难的部分,而且导师需要话费很多时间检查和评估 PCB 设计,所以导师设计了课程“QuadLint”来进行作品自动分析和打分。
改论文指出,未来的“杀手级应用程序”将是硬件、软件、传感、机器人和 / 或无线通信的交点。 这似乎是正确的——特别是当我们看到像大疆这样的公司成功的原因,和电子元件推动价格下降的可能性。 因此,降低组件的成本,提高其易用性会更有利于无人机安全性能的加强。虽然硬件和软件功能不足,而且如今价格有些昂贵,但这种情况不会很久。
阅读更多:https://arxiv.org/abs/1810.07646
亚马逊的研究人员尝试赋予 Alexa 等个人助理对特定话题进行长时间对话的能力。他们在一篇新研究论文中表示,他们可以“通过结合会话语境和对话行为特征,扩展以前关于神经主题分类和无监督主题关键词检测的工作”,如果可以完成数据标注,个人助理会比之前的版本进行更长、更连贯的对话。
研究人员使用 2017 年“Alexa 奖”竞赛期间收集的数据,由超过 100,000 个包含用户和聊天机器人之间互动的对话组成,每个话语的主题被分为 12 个类别(例如:政治、时尚、科学和技术等)以增强这些数据,对用户或聊天机器人的意图进行分类(例如:澄清、信息请求、主题切换等),并让注释人员对每个聊天机器人的回应进行排名,指标为回应的可理解程度、相关程度、有趣程度以及用户是否可能希望继续与机器人进行对话。
研究人员进行了两个基准测试:DAN,基于袋子神经模型,以及 DAN 注意的延伸 ADAN,并开发两个版本的双向 LSTM(BiLSTM)系统,其中一个使用来自带注释的数据集的上下文,而另一个没有。之后,他们对包含上下文的系统,包含数据的系统以及包含上下文和数据的系统进行基准测试(仅包含当前话语),评估所有这些方法。结果表明,使用上下文顺序的 BiLSTM 测试成绩几乎是使用上下文和对话的 ADAN 系统的两倍,并且比使用上下文和对话的 DAN 成绩几乎高 25%。
此结果表明,如果开发人员能够承担标注成本,就有可能使用有关上下文和主题的其他信息来加强语言交互数据集,从而创建更强大的系统。这意味着,在自然语言领域,我们有望看到大公司将不仅会投资于基本的转录和标记文本,还会进行更精细的元分类,深度学习的产业化将继续下去!
阅读更多:对话系统的上下文主题建模(https://arxiv.org/abs/1810.08135)。
蒙特利尔学习算法研究所(MILA)的研究人员设计了一个名为 BabyAI 的免费工具,测试 AI 系统在 2Dgridworld 环境中学习普遍技能的能力。结果表明,如今的 AI 算法在这种任务中数据效率和泛化能力效果非常差。
研究人员写道,BabyAI 在 gridworld 环境中足够高效,研究人员可以使用该平台而无需访问大量计算池 ; BabyAI 环境可以在现代多核笔记本电脑上以高达每秒 3,000 帧的速度运行,也可以与 OpenAI Gym 集成。
BabyAI 使用一种“相对较小但又富含组合的英语子集”,称为婴儿语言,旨在帮助研究人员为代理编写更加复杂的指令串,同时保持状态空间不会膨胀太快。
今天的 AI 技术是否足以解决 BabyAI 问题?基准测试结果表明,系统能够学习执行基本任务,但很难模仿专家处理需要采取多行动解决问题的任务,如今的算法在学习所有任务时都非常低效,即使是面对简单的任务也需要大量演示和模拟进程。此外,使用预训练(在尝试某些水平之前学习其他任务)不会产生很好的效果,最多能得到 3 倍加速。
BabyAI 这样的平台为 AI 研究人员提供了快速、高效的工具用于解决艰难的项目,但也凸显了当今许多算法的不足之处。迁移学习结果表明,“当涉及到具有组合结构的学习任务时,当前的模仿学习和强化学习方法在泛化和概括上的能力很弱。” “未来研究的一个明显方向,就是找到提高语言学习数据效率的策略。”
获取 BabyAI(GitHub)代码:https://github.com/mila-udem/babyai
阅读更多:BabyAI: First Steps Towards Grounded Language Learning with a Human In the Loop (https://arxiv.org/abs/1810.08272)
阿利坎特大学 3D 感知实验室的研究人员设计了 UnrealROX,这是一款基于虚幻引擎 4 的高保真模拟器,用于模拟和训练触敏机器人中的 AI 代理。
UnrealROX 由这几部分组成:模拟抓取系统,可应用于各种手指配置;使用商业 VR 设备(如 Oculus Rift 和 HTC Vive)控制机器人手和身体的程序;用于存储场景中完整序列的记录器;以及可变化的相机位置。
但研究人员指出,此模拟器是有缺点的,即虽然整个模拟器可以以每秒 90 帧的速度运行,但对大多数人工智能研究来说并不是特别有用,除非速度能够更快。
UnrealROX 支持两个机器人:Aldebaran 公司的模拟“Pepper”机器人,以及 UE4 的人体模型的精简版本。这两款机器人都设计有可扩展、可变化的抓取系统,让它们与周围的世界接触并互动。 “抓取系统的主要目的在于操纵并与不同的物体进行互动,无论物体是什么形状和姿势。”
当前,模拟环境数量的增多代表了人工智能研究中的一股模拟热潮,它最终将会在历史上留下痕迹,记录下我们对机器人互动交流方式的探索。无论 UnrealROX 是否被应用,它都将在历史上留下一页。
家庭 / 公寓租赁服务公司 Airbnb 发表论文,公布了他们如何将 AirBnB 的主要列表搜索引擎转换为基于神经网络的系统的详细信息。本文重点强调了在产品和研究中部署 AI 系统的不同,并表示这是继谷歌在 2015 年用“RankBrain”增强其搜索引擎之后的另一大突破。“RankBrain”是一个基于神经网络的系统,发布之后几乎在一夜之间成为选择向用户显示搜索结果的最重要因素之一。 “这篇论文面向的是那些拥有机器学习系统并开始考虑使用神经网络(NN)的团队,”研究人员写道。
AI 研究的其中一个秘密之一,就是前沿研究于生产用例之间的鸿沟,研究人员偏爱在样本任务中的新方法,而行业和大企业却偏爱可以大规模泛化的简单技术。该研究的目的就是解决这样的问题,研究人员从开始使用单层神经网络模型,之后使用更复杂的系统,再选择扩大规模的解决方案作为最终产品。 “通过简单地将训练数据缩放 10 倍并移动到具有 2 个隐藏层的 DNN,这并不复杂。”
Airbnb 的主要搜索引擎采用深度学习进一步表明,深度学习已进入工业化阶段,大型公司将会采用该技术并将其整合到最重要的产品中。每当出现类似的论文时,关于“AI 寒冬将来”的声音就会减少一些,因为它创造了另一个将会激励商业行为的因素,不管监管政策和行业趋势如何,都不会减少对人工智能研究和开发的投资。
阅读更多:Airbnb 搜索引擎的深度学习应用(https://arxiv.org/abs/1810.09591)
谷歌网页搜索转向 AI 机器(https://www.bloomberg.com/news/articles/2015-10-26/google-turning-its-lucrative-web-search-over-to-ai-machines)
中国计算机视觉创业公司码隆科技(Malong)开源了 CurriculumNet 的代码和数据,这是一种从互联网上收集大量带有可变注释数据的深度神经网络的技术,帮助那些没有针对特定任务的大型、已标记数据集的研究人员提供便利。但是,以这种方式收集的数据集上的标签比手动标注的数据集中的标签要嘈杂得多,要训练处有用的神经网络,研究人员需要面临着从噪声中提取足够信号的挑战。
CurriculumNet:研究人员在 WebVision 数据库上训练他们的系统,该数据库包含超过 2,400,000 张带有噪音标签的图像。他们的方法是在整个数据集上训练一个 Inception_v2 模型,之后研究所有图像映射到的特征空间;此后,CurriculumNet 将这些图像分类,根据特征空间中所有图像的相似程度将每个聚类分为三个子集。接着,他们开始使用具有相似图像特征的子集开始模型训练,再混合到噪声较大的子集。通过标记好的数据迭代学习分类器,添加具有噪声的分类器,研究人员表示其能够增强系统的泛化能力。
研究员在 CurriculumNet 上测试四个基准:WebVision,ImageNet,Clothing1M 和 Food101。他们发现,使用最大量的噪声数据训练的系统比没有噪声的训练数据收敛准确度更高,WebVision 上的误差减少多个百分点(“这些进步对于如此大规模的挑战是很重要的,”他们写道)。 CurriculumNet 在 WebVision 上的准确度最高,而且训练数据越多,性能越好(例如结合 ImageNet 和 WebVision)。
CurriculumNet 类似的系统展示了研究人员可以如何利用标记不佳的数据,结合聪明的训练理念,来提高低质量数据的价值,与从自然资源中提取有用物质的过程类似。
阅读更多:CurriculumNet:在大规模网络图像中进行弱监督学习(https://arxiv.org/abs/1808.01097)
码隆 Github 页面获取训练模型:https://github.com/MalongTech/research-curriculumnet
作者 Jack Clark 有话对 AI 前线读者说:我们对中国的无人机研究非常感兴趣,如果你想要在我们的周报里看到更多有趣的内容,请发送邮件至:jack@jack-clark.net。
原文阅读:https://jack-clark.net/2018/10/30/import-ai-118-airbnb-splices-neural-net-into-its-search-engine-simulating-robots-that-touch-with-unrealrox-and-how-long-it-takes-to-build-a-quadcopter-from-scratch/
如果你喜欢这篇文章,或希望看到更多类似优质报道,记得给我留言和点赞哦!