AI 前线导读:
- 李飞飞离职谷歌重返斯坦福,Andrew Moore 接任
- 大疆在美遭控诉侵犯专利,控诉方为中国同行
- 机器学习科学家黄恒出任京东大数据首席科学家
- 商汤获软银 10 亿美元投资,估值 60 亿美元
- 斯坦福与 UC 创建驾驶空间认知环境 Gibson
- 乌克兰国立技术大学创建中世纪图像数据集
- 上海交大用 IDSGAN 生成恶意流量示例,成功躲避防御机制
- 微软 AirSim 与爱尔兰国立大学联合研究智能灾难反应无人机
- FB AI 研究院用 128 个 GPU 并行训练,加快机器翻译速度
- 最新调查显示美国民众对人工智能的态度
更多干货内容请关注微信公众号“AI 前线”(ID:ai-front)
北京时间 9 月 11 日凌晨,Google 云 CEO 戴安娜·格林证实,担任 Google 云 AI/ML 首席科学家两年后,李飞飞决定重返斯坦福校园任教,但未来会继续担任谷歌的顾问。
此前李飞飞将要离开谷歌的传闻终于得到证实。根据斯坦福大学计算机视觉实验室官网消息,李飞飞离开谷歌是因为在谷歌的工作严重影响了她的教学工作。
她的接任者为前卡耐基梅隆大学(CMU)计算机学院院长 Andrew Moore。Andrew 从 1991 年在剑桥大学获得博士学位,1993 年加入 CMU,成为计算机科学和机器人学的助理教授,2014 年 8 月担任 CMU 计算机学院第五任院长,促进了 CMU 计算机学院在今年正式增加了 AI 的本科学位。
中国无人机企业大疆遭到指控侵权专利权。据国家商务部网站消息,美国 Autel Robotics 公司依据《美国 1930 年关税法》第 337 节规定向美国际贸易委员会 (ITC) 提出申请,指控深圳市大疆创新科技有限公司及其关联公司对美出口、在美进口或在美销售的无人机及其组件(Unmanned Aerial Vehicles and Components Thereof)侵犯其专利权,请求 ITC 发起 337 调查并发布有限排除令和禁止令。
据了解,控诉方为美国 Autel Robotics 公司,是深圳市道通科技股份有限公司的子公司。道通科技在进入无人机领域后,与大疆发生过多次专利纠纷,积怨已久。大疆方面的发言人表示,由于案件尚在诉讼阶段,对此不予置评。
9 月 6 日,京东集团宣布,美国匹兹堡大学 John A. Jurenko 冠名讲席教授黄恒博士加入京东,将任京东大数据首席科学家。
黄恒教授是机器学习、人工智能、大数据、计算机视觉等领域国际领先的科学家。据悉,黄恒教授将加入位于硅谷的京东大数据与智能供应链事业部研发中心,担任京东大数据首席科学家,他的工作重点将聚焦于京东大数据平台上的机器学习平台和深度学习平台研发、优化模型与算法中心及学术研究。
9 月 10 日,软银中国向 AI 芯片研发公司商汤科技投资 10 亿美元,商汤的估值达到 60 亿美元。
在过去 14 个月里,商汤完成了至少 4 轮融资,共获得融资总额可能超过 27 亿美元,投资者包括高通、阿里和淡马锡等知名的投资基金等。
商汤科技的主要研究领域包括面部识别、自动驾驶和增强现实(AR) 领域,同时投资于领域包括医疗、物联网、手机应用和游戏等领域。
来自斯坦福大学与加州大学伯克利分校的研究人员们创建了 Gibson 项目——一套用于教授机器代理建立驾驶空间认知的环境,是可供现代研究人员使用的重要导航环境。其特殊之处包括:基于真实空间的环境以及极为精妙的渲染技术,能够确保 Gibson 内机器代理所看到的图像通过“嵌入机制更紧密地匹配现实世界场景,从而消除 Gibson 渲染结果与真实景象间的差异。”
规模: Gibson 基于虚拟真实空间,而非采用人工设计的空间。其目前包含来自 572 座完整建筑的,超过 1400 层楼面空间。此外,研究人员还将 Gibson 数据集的总大小与其它大型环境数据集(包括「SUNCG」与 Matterport3D)进行了比较,并证明 Gibson 的导航复杂性更合理,且实际传输误差水平也低于其它系统。
数据收集: 研究人员们利用多种不同扫描设备为 Gibson 收集数据,具体包括 NavVis、Matterport 以及 Dotproduct。
实验: 那么,Gibson 的实际作用究竟如何?研究人员进行了多项实验用以评估其有效性,其中包括实地避障实验、远程视觉导航与爬楼梯 ; 外加迁移学习实验,例如测量系统的深度估算与场景分类能力。
局限性: Gibson 本身存在一些局限性,包括缺乏对动态内容(例如其它移动对象)的支持,亦无法直接对环境本身进行操作。未来的测试将主要集中在判断 Gibson 能否帮助成品机器人提升空间认知能力方面。
了解更多: Gibson Env: Real-World Perception for Embodied Agents (Arxiv)。
相关网站:Gibson on GitHub(https://github.com/StanfordVL/GibsonEnv)
乌克兰国立技术大学的研究人员们在乌克兰基辅市的圣索菲亚大教堂创建了一套用两套字母表(格拉高里字母表与斯拉夫字母表)编写而成的中世纪图像数据集,旨在为研究人员们提供可用于训练及开发有监督与无监督分类及生成系统的数据资源。
数据集: 研究人员们创建的这套 Carved Glagolitic and Crillic 字母(简称 CGCL)数据集中,包含来自超过 4000 张图像的 34 种字母。
学术价值: 基础监督学习的一大特点在于,只要拥有充足的数据,即可相对轻松地自动实现对事物的感知——这些数据集的进一步数字化亦增加了未来我们利用无人机或者机器人自动扫描世界各地古迹、识别并抄写数百年甚至数千年前文字的可能性。涂鸦万岁!
了解更多: Open Source Dataset and Machine Learning Techniques for Automatic Recognition of Historical Graffiti (Arxiv)。
来自上海交通大学与上海信息安全综合管理技术重点实验室的研究人员们利用生成对抗网络以创建恶意网络流量,旨在回避入侵检测系统的追踪。他们的 IDSGAN 技术以 Wasserstein GAN 为基础,生成器能够在训练之后创建出对抗性恶意流量 ; 而经过训练的分类器则能够协助黑盒入侵检测系统对此类流量进行意图识别。
他们解释称,“这套模型的目标在于利用 IDSGAN 生成恶意流量示例,这些示例能够骗过并回避防御系统的检测。”
测试: 为了测试自己的方法,研究人员们使用 NSL-KDD,这是一套包含互联网流量数据以及四种恶意流量的数据集,分别为探测、拒绝服务、用户到 root 以及 root 到本地。此外,他们还利用多种不同算法增强入侵检测系统的功能,包括支持向量机、朴素贝叶斯、多层感知、逻辑回归、决策树、随机森林以及 k 最近邻算法。 整体测试结果表明,IDSGAN 方法能够将 DDoS 的检测率由 70% 到 80% 下降至 3% 到 8%。
但目前的测试方法还不够严格,对抗商业型入侵检测系统还不成熟。
学术价值: 随着大量数字数据的出现,加之人类网络安全专业人员明确要求建立能够筛选大量数据的适应性策略,网络安全已经成为人工智能领域的一大重要发展方向。利用上述基础性方法对人工智能在网络安全领域可行性的证明,未来这类技术有望在安全保障方面发挥更大的作用。
了解更多: IDSGAN: Generative Adversarial Networks for Attack Generation against Intrusion Detection (Arxiv)。
爱尔兰国立大学戈尔韦分校的研究人员正在研究无人机模拟器,旨在建立一套能够用于训练无人机发现有害物质的环境。该模拟器“专注于识别并收集与建模现象相关的关键取证证据,从而开发并测试能够自主处理化学、生物、放射 / 核或爆炸(简称 BCRNe)事件的系统。”
实现过程: 研究人员希望模拟器实现其它更为实际的测试方向,包括模拟化学、生物与放射性威胁。该模拟器与微软研究院的“AirSim”无人机模拟器联合,旨在实现巡航盘点与航线的自动生成。到目前为止,结果相当乐观:系统能够切实起效,训练无人机建立起导航能力,甚至能够(粗略地)模拟与 CBRNe 事件相关的物理现象。
未来展望: 为了进一步证明该方法的价值,研究人员需要证明他们能够在该系统中训练出模拟代理,从而轻松识别并定位危险材料。当然,最终能否成功,还是要看这些系统在现实场景下的实际表现。
学术价值: 无人机是人工智能在真实世界中进行部署的主要平台之一,这一方面是因为为无人机开发人工智能系统的难度低于常规机器人,另一方面则在于无人机具有环境监控及分析等直观用途。可以想象,未来我们开发及训练的无人机将巡逻各类不同环境,寻找对该环境的威胁(例如确定此处存在有害物质)或者潜在的极端天气事件(火灾、洪水等)。从长远来看,这一研究意义重大。
了解更多: Using a Game Engine to Simulate Critical Incidents and Data Collection by Autonomous Drones (Arxiv)。
Facebook AI Research 的研究人员们已经展示了如何在获得最高 BLEU 分数的同时,加快神经机器翻译系统的训练速度。这昭示着我们将进入 AI 时代,在基础设施领域投入巨资的企业正在大规模运行模型,且其并行训练规模(在本案例中为单一训练项目中使用 128 个 GPU)远超大多数研究人员的资源水平(包括不少大型学术实验室)。
Facebook 公司目前的新研究主要指向两个方面:改进单机神经机器翻译系统的训练过程,以及改进大规模机器集群的训练过程。
单机加速: 研究人员表示,他们可以以较低的精度(16 位,而非 32 位)进行训练,并“将训练时间缩短 65% 至 40%,且不影响准确性。通过单机加速测试,他们发现完全能够在约 5 小时之内训练完成一套系统,且准确度可达 26.5——比先前最强大的技术方案快约 4.9 倍。
多机加速: 而通过在 16 台机器上进行并行化训练,他们能够进一步将训练时间减少 90%。
结果: 他们通过两种语言对测试了自己的系统,分别为英语到德语以及英语到法语。在 16 节点训练场景下(每节点 8 个 V100 GPU,通过 InfiniBand 互连),他们在 85 分钟内获得了 29.3 的英语到德语 BLEU 得分。而英语到法语的训练周期则为 512 分钟(8.5 小时),得分为 43.2。
学术价值: 随着大型模型的训练周期越来越短,人工智能研究人员将能够更轻松地完成自己构思的大规模实验——这一点对于拥有充足资源及商业支持的私营部门研究实验室而言尤为重要。随着时间的推移,这样的研究可能会为采用相关技术的组织带来复合性优势,包括研究人员的工作效率将远远高于其它竞争对手(在某些特定领域中,规模化本身亦可带来显著收益)。
了解更多: Scaling Neural Machine Translation (Arxiv)。
了解更多: Scaling neural machine translation to bigger data sets with faster training and inference (Facebook blog post)。
布鲁金斯思想组织对美国公众对人工智能技术的态度进行了一项最新调查。
支持在战争中使用人工智能,但前提是敌对方已经这样做了:受访者反对将人工智能用于战争(38% 反对,30% 支持)。不过如果敌对方针对战争活动开发人工智能,则观念发生反转(47% 支持,25% 反对)。
强烈支持开发人工智能并加以道德监督:
– 62% 的受访者认为人工智能应受到人类价值观的影响(21% 反对)。
– 54% 的受访者认为应该要求企业聘请伦理学家(20% 反对)。
– 67% 的受访者认为企业应组建道德审查委员会(14% 反对)。
– 67% 的受访者认为企业应建立人工智能道德规范(12% 反对)。
– 65% 的受访者认为企业应对员工进行道德培训(14% 反对)。
学术价值: 很明显,大部分民众普遍支持在人工智能开发中引入道德监督制度,并要求行业及政策制定者对此加以重视。公众对于人工智能的强烈反对,是该行业在发展中期所面临的最大风险之一。最近已经出现了类似的情况:在福岛核电站灾难发生之后,德国一系列公众活动开始表达抗议,并迫使德国政府于 2011 年宣布完全淘汰核电。
了解更多: Brookings survey finds divided views on artificial intelligence for warfare (布鲁金斯)
作者 Jack Clark 有话对 AI 前线读者说:我们对中国的无人机研究非常感兴趣,如果你想要在我们的周报里看到更多有趣的内容,请发送邮件至:jack@jack-clark.net。
原文链接:
https://jack-clark.net/2018/09/10/import-ai-111-hacking-computers-with-generative-adversarial-networks-facebook-trains-world-class-speech-translation-in-85-minutes-via-128-gpus-and-europeans-use-ai-to-classify-1000-year-old-graffi/
如果你喜欢这篇文章,或希望看到更多类似优质报道,记得给我留言和点赞哦!