回顾2017,机器学习和人工智能界有哪些重大事件值得我们回味呢?2018年又有哪些值得期待的技术成果诞生?KDnuggets网站向几位机器学习和AI专家咨询了2017最重要的行业发展成果,以及他们对2018年关键趋势的预测意见。
首先让我们回顾一下2016年行业的主要趋势和预测,主要集中在这四个领域:
AlphaGo的成功;
对深度学习的狂热;
自动驾驶汽车;
TensorFlow以及神经网络的应用
在2017年结束之际,我们和大数据、数据科学、人工智能还有机器学习界的几位专家谈了谈,了解了一下他们对2017年重要成果的看法以及2018年重要的趋势是什么。如果你也感兴趣,就接着往下看吧~
Xavier Amatriain,Curai公司的联合创始人兼CTO、前Quora工程副总裁、前Netflix研发/工程总监
如果一定要做出一个选择,那么我认为AlphaGo Zero是今年的最大亮点。这种新方法不仅能在一些最先进的方向上有所改进(例如深度强化学习),这种无需数据就能学习的方法还代表着一种全新模式。而且AlphaGo Zero现在已经能自学国际象棋等好几种棋类游戏了,非常令人惊叹。
再看人工智能方面,年初的PyTorch后来居上,颇有挑战TensorFlow的趋势,尤其是在研究领域。不过TensorFlow也不甘示弱,立刻发布了动态网络TensorFlow Fold。
大公司之间的“AI之战”涉及方方面面,不过最激烈的还是“云”的竞争。现在所有主要的供应商都加紧了对云服务的支持。亚马逊已经对AWS进行了大量创新,比如最近推出的用来构建和部署ML模型的Sagemaker。除此之外一些小型玩家也加入了进来。英伟达最近推出了他们的GPU云,这将成为训练DL模型的另一个有趣的选择。尽管有竞争,但是各大公司在必要时也会选择合作。Facebook与微软等公司合作推出的最新版ONNX正是实现共享神经网络的重要一步。
2017年,围绕人工智能所展开的社会问题也进一步延续升级。埃隆·马斯克(Elon Musk)仍然觉得我们慢慢会造出杀人机器人。还有很多关于人工智能在未来几年会影响工作的言论。最后,还有很多关于AI算法透明度和偏见的讨论。
关于Xavier Amatriain的更多观点,可以查看:https://www.kdnuggets.com/2017/12/xavier-amatriain-machine-leanring-ai-year-end-roundup.html
Pedro Domingos,华盛顿大学计算机科学与工程系教授
人工智能Libratus战胜德州扑克顶级选手,将AI的主导地位扩展到不完善的信息博弈中(www.cmu.edu/news/stories/archives/2017/january/AI-beats-poker-pros.html);
自动驾驶汽车和虚拟助手的竞争越来越激烈,Alexa在虚拟助手中脱颖而出;
谷歌、亚马逊、微软、IBM之间的云人工智能发展竞赛层出不穷;
AlphaGo Zero非常强大,但不是一项突破。自我对抗是ML最原始的原理之一,但人类不用对战500万局游戏就能掌握围棋的下法。
Charles Martin,数据科学家、机器学习和人工智能咨询
2017年见证了深度学习作为AI的平台发展上升的过程。今年,Facebook发布了PyTorch,成为TensorFlow强有力的竞争对手。除此之外,Gluon、Alex、AlphaGo都在不断进步。ML从特征识别和逻辑回归发展到阅读文章、搭建神经网络、优化训练效果。在我的咨询工作中,客户已经在寻求个性化的物体检测、高级的NLP模型以及强化学习。当市场和比特币飙升的时候,人工智能一直是场沉默的革命,零售业的变革表明人工智能将占领这一行业。在工作中我发现,公司都积极地想改变自己,他们对在技术和战略方面应用人工智能非常感兴趣。
2018年必将成为全球人工智能经济突破的第一年。我们有来自欧洲、亚洲、印度甚至沙特阿拉伯的需求。全球需求将继续增长,中国、加拿大、印度等国正将重点从IT转向人工智能。同时,不管是美国还是海外,对企业培训的需求也很大。人工智能将使效率大规模提高,让许多传统行业,如制造业、医疗保健和金融业都受益。人工智能创企将把新产品推向市场并全面提高投资回报率。而不管是机器人还是自动驾驶技术,都将会带来惊人的改变。
对创新来说,这将是伟大的一年。
Nikita Johnson,RE.WORK的创始人
2017年,ML和AI取得了巨大的进步,特别是最近DeepMind推出的一般强化学习算法,能够在四小时内自学,打败了世界上最好的棋类计算机程序。
2018年,我希望看到智能的自动化设备渗透到更多公司,例如传统制造业、零售业以及公共事业公司。随着数据收集和分析的不断增加,企业对自动化系统战略的需求将至关重要,这将让公司把AI列入长期投资计划中,并将其看作是企业未来增长的优先事项。
我们还将看到,自动化的机器学习系统能帮助非AI研究人员更容易地使用该技术,并使更多的公司能将机器学习方法应用到他们的工作场所中去。
Georgina Cosma,诺丁汉特伦特大学科学与技术学院的高级讲师
机器学习,特别是深度学习模型,正在对一些特殊领域产生重要影响,例如医疗保健、法制体系、工程领域以及金融行业。但是,大部分机器学习模型并不容易解释。了解一个模型如何实现在分析和诊断模型中非常重要,因为人们需要有足够的信心相信模型的预测。重要的是,一些机器学习模型做出的决定符合规则。现在我们需要创建足够透明的深度学习模型来解释它们的预测,特别是当这些模型用来影响人类的决策时。
Ajit Jaokar,首席数据科学家,牛津大学数据科学和物联网课程的创建者
2017是AI元年,2018将是AI成熟的一年。我们更多的是从“系统工程或云原生”的角度看待人工智能,AI正变得越来越复杂,而像h2o.ai这样的公司就简化了部署AI的复杂性。
我看到AI正越来越多地成为竞争优势,特别是在工业物联网、零售和医疗保健方面。同时,AI正迅速被应用在企业的各个层面,虽然会增加新的工作机会,但也会导致大量失业。因此,AI的热度已经超越了Python与R之争。
我认为AI是通过嵌入式人工智能(即跨越企业和物联网的数据科学模型)将传统企业与更广泛的供应链合并。
最后,除了银行业等传统企业之外,整个行业对懂得AI或深度学习的数据科学家将继续处于短缺状态。
Hugo Larochelle,谷歌研究科学家,加拿大高级研究机构和大脑学习机构的副主任
我最感兴趣的机器学习领域是元学习(meta-learning)。元学习是一个比较宽泛的说法,但今年,最令人激动的是少数学习问题上取得的进展,它解决了从少数几个例子中发现学习算法的问题。Chelsea Finn今年年初时总结了这个话题早期进展,博客地址:bair.berkeley.edu/blog/2017/07/18/learning-to-learn/。值得注意的是,在现在很多机器学习方面的博士生中,Chelsea Finn被认为是今年最令人印象深刻的学生之一。
今年后半年,关于少数案例的元学习研究就更多了。例如使用深度时空域卷积网络 ,图形神经网络及其他。我们还看到用元学习方法主动学习,冷启动项目推荐,few-shot分布估计,强化学习,分层强化学习,模仿学习,等等。
Sebastian Raschka,密歇根州立大学应用机器学习和深度学习研究者、计算机生物学家、Python Machine Learning一书的作者
在过去几年中,开源社区就已经对新出现的深度学习框架进行了大量讨论。现在这些工具已经大致成熟了,我希望并且期待看到更多不再依赖于工具的方法,而是将精力用于开发和实现利用深度学习的新颖想法中。并且,我希望看到更多利用生成对抗神经网络和Hinton的胶囊网络解决的新问题,这是今年讨论的热门话题。
此外,基于我们最近的一篇关于半对抗神经网络(semi-adversarial neural nets)论文中所写的将隐私赋予到脸部图像中,用户隐私在深度学习中是一个非常重要的问题,我希望这个话题将在2018年继续被关注。
Brandon Rohrer,Facebook数据科学家
2017年出现了个更多机器打败人类的事件。去年,AlphaGo击败了世界上最好的围棋选手,创建了AI之路上重要的里程碑。今年,AlphaGo Zero超越了他的上一代,从头教自己下棋,不仅击败了人类,还击败了汇集所有人类经验的围棋游戏(deepmind.com/blog/alphago-zero-learning-scratch)。除此之外,现在一台机器可以在Switchboard对话语音识别任务中已经达到人类对等的水平(arxiv.org/abs/1708.06073)。
然而,人工智能的成就所覆盖的范围仍然比较窄,成果也很脆弱。图像中单个像素的改变就有可能击败最先进的图像分类器(arxiv.org/pdf/1710.08864.pdf)。我预计2018年会出现更多通用、强大的AI解决方案,“AGI”将会替代“AI”成为明年的流行词。
Elena Sharova,投资银行的数据科学家
2017年机器学习和人工智能的主要发展成果是什么?
我看到有更多的公司和个人把它们的数据和分析转移到基于云的解决方案中,同时越来越多的人意识到了数据安全的重要性。
大型技术公司正竞相成为数据分析和储存平台。对于数据科学家来说,这意味着这一平台所能提供的功能正影响着他们开发的工具箱和解决方案。
2017年,全球数据安全问题频发,这是一个不容忽视的问题。随着越来越多的数据转移到第三方存储,对于能够应对新型威胁的需求将继续增长。
看到了2018年的哪些趋势?我认为2018年将有更多公司遵守“全球数据保护条例”(GDPR),并且应对机器学习系统“隐藏”的技术。作为一项欧盟法规,GDPR具有全球影响力,所有数据科学家应该充分意识到它是如何影响他们工作的。根据谷歌NIPS 2016中的论文,数据依赖的代价高昂,而且随着企业创建复杂的数据驱动模型,他们必须思考如何解决这一问题。
Tamara Sipes,Optum/UnitedHealth集团的商业数据科学总监
深度学习和组合建模的力量在2017年继续显示出与其他机器学习工具相比的价值和优势。尤其是深度学习,在各个领域都有所应用。
至于2018年的趋势,深度学习很可能会被用来从原始的输入中生成新的特征和概念,并取代手工创建或设计新变量。深度网络在检测数据特征和结构方面是非常强大的,数据科学家们认识到无监督的深度学习可在此领域发挥更多价值。
另外,有效地异常检测可能也是近期的重点。在许多行业中,异常事件和其他异常情况都是数据科学工作的重点:入侵检测、财务欺诈检测、医疗保健中的欺诈、浪费、滥用和错误以及其他故障等等。检测这些不常见的事情是使企业在竞争中保持优势的方法,了解这些时间的本质是这一领域有趣且困难的挑战。
Rachel Thomas,fast.ai创始人,USF教授助理
虽然没有AlphaGo和会后空翻的机器人那样惊艳,但2017年最令我兴奋的事情是深度学习框架变得更加友好且易于访问。今年发布的PyTorch对任何熟悉Python的人都很友好(主要是由于动态计算和OOP设计)。即使是TensorFlow也正朝着这个方向发展,将Keras加入到其核心代码库并宣布动态执行。我希望可以看到2018年编程人员使用深度学习框架的障碍越来越低。
第二个趋势是媒体报道关于政府将人工智能用于监督的数量将会增加。隐私威胁在今年已经不是什么新鲜事了,但直到最近才受到广泛关注。例如用深度学习来识别戴着围巾和帽子的示威者,或者用图片判断某人的性取向,使得今年更多媒体开始关注AI隐私风险。希望2018年不只是能看到马斯克担忧AI的言论,还能有更多对隐私、监控的关注,以及在通过编码消除对性别和种族的歧视。
Daniel Tunkelang,Twiggle的首席搜索传播者、知名组织顾问
对自动驾驶和语音助手来说,2017年是意义重大的一年。这两个应用是深度学习如何从小说变为现实的典范。
但是今年机器学习和AI最重要的发展成果是对于道德、可靠性以及可解释性上的研究。埃隆·马斯克(Elon Musk)今年关于人工智能可能会带来世界大战的言论引发了媒体的激烈讨论,奥伦·埃佐尼(Oren Etzioni)和罗德尼·布鲁克斯(Rodney Brooks)等人都参与反驳。尽管有人说他是危言耸听,但我们真切地面临着机器学习模型中明显的差异和危险,比如word2vec里面的性别歧视、刑事判决所用的算法中的种族主义,以及对社交媒体反馈评分的故意操纵模型。这些都不是新问题,但是机器学习,特别是深度学习,却让这一现象更加严重。
我们终于看到可解释的AI作为一门学科出现,它结合了学者、业界从业者以及政策制定者。希望明年,我们将有更多动力照亮深度学习这个黑盒子。