在过去的一年里,我们目睹了AI与顶级人类玩家在游戏领域的较量,见证了年度图灵奖的荣耀颁布,同时也体验了各式各样基于AI的视频和语音应用程序,欣喜地看到AI医疗正在加快造福人类的步伐。
本文中,知名技术专家Grigory Sapunov将为我们剖析2018-2019年不容错过的AI发展进程。
(Grigory Sapunov,Inten.to联合创始人兼CTO,资深软件工程师,拥有超过20年编程经验。擅长领域:深度学习、机器学习、数据科学、软件工程、产品管理、项目管理等。)
逼真的内容生成
深度视频肖像
斯坦福大学访问助理教授Michael Zollhöfer等学者提出了一种新颖的方法,可以仅使用输入视频就实现肖像视频的照片级逼真的动画效果。
GAN 迅速进化
随着GAN(生成式对抗网络)的迅速进化,学术界开始探讨如何预测、预防和缓解人工智能的恶意使用(The Malicious Use of Artificial Intelligence: Forecasting, Prevention, and Mitigation)。
高分辨率照片级的视频翻译
该技术可用于将语义标签贴图转换为照片般逼真的视频,实现从边缘图像进行合成,或从姿势生成人体运动。
基于以上图像技术所实现的示例如下:
BigGAN——用于高保真自然图像合成的大规模GAN训练。
GauGAN——NVIDIA Research开发的深度学习模型能将粗略的涂鸦转变成令人叹为观止的逼真杰作。基于该模型的交互应用程序被命名为GauGAN。
NVIDIA实时光线追踪
NVIDIA DRIVE Constellation自动驾驶仿真平台
自然语言处理(NLP)
NLP的ImageNet时代来临
作为NLP的核心表现技术——词向量,其统治地位正在被诸多新技术挑战,如:ELMo,ULMFiT及OpenAI变压器。这些方法预示着一个分水岭:它们在NLP中拥有的影响,可能和预训练的ImageNet模型在计算机视觉中的作用一样广泛。
Google BERT模型
基于此构建的CoQA是用于构建会话问答系统的大型数据集。CoQA挑战的目标是衡量机器理解文本段落的能力,并回答对话中出现的一系列相互关联的问题。
OpenAI GPT-2
这是一个大规模的无监督语言模型,可生成连贯的文本段落,在许多语言建模基准上实现了领先表现,并执行基本的阅读理解、机器翻译、问答和总结。
语音和声音
智能音箱将成为全球销售增长最快的联网设备
Google Assistant等智能语音助手的升级为我们的生活带来了丰富多彩的智能化体验。德勤预测,2019年智能音箱行业规模将达到70亿美元,成为全球销量增长最快的联网设备。
新方法: 2.5D sound
该方法利用视频将单声道音频转换为双耳音频。
AI 战略
世界各国正在制定政府以及政府间的战略和举措,以指导AI的发展。全球合作、标准和规范将成为推动安全和有益的AI的关键组成部分。随着AI技术的进一步发展,所有国家和全球大国之间的协调与合作将越来越需要。
图灵奖——计算领域的诺贝尔奖
“深度学习之父” Yoshua Bengio, Geoffrey Hinton和Yann LeCun荣获2019年美国计算机协会图灵奖。
通用人工智能(AGI)
Geoffrey Hinton认为距离通用人工智能还有很远。
游戏
DeepMind AlphaZero
在构建AlphaGo并以4-1击败全球最出色的围棋棋手李世石之后,谷歌DeepMind又打造出AlphaZero,并打败了众多世界上最强大的机器棋手。国际象棋大师Garry Kasparov认为,AlphaZero产生的知识是人类可以学习的信息。它以一种深刻而有用的方式超越了我们,这个模型可能会复制到可以生成虚拟知识的任何其他任务或领域。
OpenAI Five
5个由神经网络组成的OpenAI Five战队在Dota 2电竞游戏中击败顶级职业玩家。
AlphaStar
AlphaStar在《星际争霸》中以10-1战胜人类玩家。
医药和生物学
AlphaFold
实现仅基于其基因序列来预测蛋白质的3D结构。
DeepMind与莫菲尔眼科医院建立联合研究合作伙伴关系
新阶段的研究挑战是如何利用AI帮助临床医生在患者出现症状之前预测眼部疾病。
Clara AI让每位放射科医生亲自训练出属于自己的AI
Clara AI是一个工具包,包含13个最先进的分类和分割AI,以及为放射科医生构建的软件工具。相比人工器官分割,它可以实现4到10倍的性能加速。
数字时代的医疗
Nature杂志认为AI医疗主要应用于四方面:诊断学、治疗学、人口健康管理,以及行政与法规。
大规模的现实生活应用
阿里巴巴杭州ET城市大脑2.0
该系统可实现实时的交通预测和管理。
DeepMind自动化数据中心冷却和工业控制系统
DeepMind优化风能发电系统
Amazon Go自动化实体店
Amazon Scout
全电动配送系统,以步行的速度沿着人行道滚动,旨在使用自动配送设备安全地为客户提供包裹。
FedEx SameDay bot
自动配送设备,旨在帮助零售商向其客户提供当天和最后一英里的交付。
KiwiBot外卖配送机器人
该机器人创下日配送500单的记录。
Tesla: 自动驾驶汽车行驶10亿英里
云上AI
加速企业使用基于云的AI软件和服务
德勤预测,2019年企业将进一步加速使用基于云的AI软件和服务。在使用AI的公司中,70%将通过基于云的企业软件获得AI功能,65%将使用基于云的开发服务创建AI应用程序,到2020年,内置AI的企业软件的渗透率和基于云的AI开发服务将分别达到87%和83%。
基于云上的AI示例包括NLP cloud APIs和Google AutoML/定制化模型等。
边缘AI
NVIDIA Jetson TK1/TX1/TX2/Xavier/Nano
Jetson Nano是一款外观小巧但功能强大的 CUDA-X™ AI计算机,为运行现代AI工作负载提供472 GFLOPS(每秒十亿次浮点运算)的计算性能,并且具有高能效,但耗电量仅为 5 瓦。
Raspberry Pi 3
华为麒麟980 ——全球首款7nm工艺移动AI芯片组
Apple A12 神经引擎
Samsung NPU
Qualcomm 骁龙855——兼具5G、AI和XR的移动平台
Intel/Movidius Neural Compute Stick 2
Google Edge TPU
点击“阅读原文”了解NVIDIA AI最新进展。