2018 AI技术、硬件与应用的全面综述:机器学习如何进化成AI

【导读】普度大学机器学习、软硬件专家Eugenio Culurciello,在其主页分享了一篇博文,详细描述了自己对机器学习、深度神经网络、人工智能的个人见解。重点介绍了机器学习如何演化成AI,以及在此过程中需要的软件、硬件、应用的特点。从软件层面介绍了当前神经网络结构的局限性,分析流行的网络结构;另外,也分析了未来AI的硬件趋势;最后对真正的AI应用进行构想。详情请参见下面的具体内容。



 


Artificial Intelligence, AI in 2018 and beyond

- Or how machine learning is evolving into AI


 2018 AI技术、硬件与应用的全面综述:机器学习如何进化成AI

by Eugenio Culurciello


本文是我对深层神经网络和机器学习引领人工智能领域看法,以及我们如何能够用更复杂的机器来帮助我们日常工作。


请注意,这些并不是对未来的预测,而是对这些领域的轨迹、趋势和技术需求进行详细的分析,以实现有用的人工智能。


并不是所有的机器学习都是针对人工智能的,我也会讨论一些不为人熟知的成果。


目标




这个领域的目标是在机器中实现人类和超人类的能力,从而可以辅助我们的日常生活。 第一个目标是实现自动,智能家居,人工助手,安全摄像头。 第二个目标是家庭烹饪,清洁机器人,监视无人机和机器人。第三个目标是移动设备上的助手或者是时刻在线的助手。第四个目标是全职助理,可以听到和看到我们的日常生活。终极目标是一个完全自主的合成体,可以在每个任务中表现出人类或超人类的水平。


软件




这里将软件定义为通过优化算法训练的神经网络结构来解决特定的任务。


当前,神经网络事实上是一种解决任务的工具,包括从大数据集进行分类的监督任务。


但这并不是人工智能,它需要解决现实问题,能在没有监督信息的条件下学习,从以前从未见过的经验中学习,可以把以前的知识结合在一起,以解决当前的挑战。


我们如何从当前的神经网络获得人工智能呢?


神经网络体系结构 - 几年前,当这个领域蓬勃发展时,我们经常说它能从数据中自动学习好的参数,因此优于手工特征。但是有些细节需要考虑:在训练的基础上解决特定任务的神经网络架构不是从数据中学习的!实际上它仍然是人为设计的。基于经验的手工制作,这是目前该领域的主要局限性之一。已有相关工作对这个方向进行研究:如“链接1和链接2”,但是还需要更多的研究。神经网络结构是学习算法的基础。即使我们的学习算法能够掌握一项新的任务,如果神经网络不正确,那么也不能完成任务。从数据中学习神经网络架构的问题是,目前要在一个大数据集中训练多层网络结构需要花费很长的时间。我们必须从头开始训练多个网络结构,并查看哪一个最有效。这个过程是非常耗时的,我们应该克服这一限制。


  • 链接1:

    http://papers.nips.cc/paper/6460-learning-to-learn-by-gradient-descent-by-gradient-descent


  • 链接2:

    https://arxiv.org/abs/1707.07012

 

无监督学习 - 我们不能总是用我们的经验指导神经网络的每一次操作。我们不可能在任何情况下都能纠正错误,并提供反馈意见。但是,这正是今天监督神经网络所做的:我们在每个实例中都提供帮助,以确保它们正确执行。相反,人类只需要从少数例子中学习,就能够连续自我校正和学习更复杂的数据。我们在“链接3”已经广泛地讨论了无监督学习。


  • 链接3:

    https://medium.com/intuitionmachine/navigating-the-unsupervised-learning-landscape-951bd5842df9

 

预测神经网络 - 当前神经网络的主要局限是它们不具有人类大脑最重要的特征之一:预测能力。关于人脑如何工作的一个主要理论是不断做出预测:预测编码。如果你仔细想一想,其实我们每天都会经历这些。当你提起一个你认为很轻但结果很重的物体。它让你感到惊讶,因为当你接近它的时候,你已经预测它将如何影响你但结果却出乎意料。


预测不仅能让我们了解世界,还能让我们知道什么时候我们不会,什么时候我们应该学习。事实上,我们大脑中保存了一些我们不知道的信息,并且让我们感到惊讶,所以经历过一次下次他们就不会了!认知能力与我们在大脑中的注意力机制有明显的联系:我们可以放弃99.9%的感官,只专注于我们生存的非常重要的数据——威胁在哪里,我们就从哪里逃避它。例如,当我们匆忙地走出家门时,我们会想手机在哪里。


构建预测神经网络是与现实世界交互以及在复杂环境中工作的核心。 因此,这是任何强化学习工作的核心网络。更多的请参阅下文。


我们已经讨论了预测神经网络,并且我们是研究和创建预测神经网络的先驱团队之一。有关预测神经网络的更多详细信息,请参阅下面链接:


  • https://towardsdatascience.com/a-new-kind-of-deep-neural-networks-749bcde19108


  • https://medium.com/@culurciello/predictive-neural-networks-for-reinforcement-learning-490738725839


  • https://towardsdatascience.com/adversarial-predictive-networks-3aa7026d53d2

 

当前神经网络的局限性 - 我们之前已经讨论过神经网络的局限性: 无法预测,内容上的原因,并有短暂的不稳定性 - 我们需要一种新的神经网络,参见下面链接。:


  • https://towardsdatascience.com/a-new-kind-of-deep-neural-networks-749bcde19108

 

胶囊神经网络是解决当前神经网络局限性的一种方法。我们在“链接4”进行回顾。 我们认为,胶囊必须扩展一些额外的功能:


  • 链接4:

    https://medium.com/mlreview/deep-neural-network-capsules-137be2877d44

 

  • 对视频帧进行操作:这个很简单,因为我们需要做的就是在最近的历史中使胶囊路由查看多个数据点。这相当于在最近的重要数据点上进行联想记忆。注意,这些并不是最近的帧的最新表示,而是最近帧的最不同的表示。可以通过仅保存不同于预定义值的表示来获得具有不同内容的不同表示。这个重要的细节只允许保存最近历史的相关信息,而不是一系列无用的数据点。


  •  预测性神经网络能力:这已经是动态路由的一部分,它迫使各层预测下一层的表示。这是一种非常强大的自我学习技术,在我们看来,它超越其他的非监督学习方法。胶囊需要能够预测长期的时空关系,但是现在还没有实现。


持续学习 - 这一点很重要,因为神经网络需要不断学习新的数据点来不断地更新。目前的神经网络只能每一次从头开始重新训练来学习新的数据。神经网络需要能够自我评估,明白它什么时候需要新的训练或它知道自己能干什么。这也需要在现实生活和强化学习任务中表现出来,我们想让机器在不忘记旧任务的情况下完成新的任务。


有关更多详细信息,请参阅Vincenzo Lomonaco撰写的博文。


  • 博文地址:

    https://medium.com/@vlomonaco/why-continuous-learning-is-the-key-towards-machine-intelligence-1851cb57c308

 

转移学习 -我们如何让算法通过观看视频进行自我学习,就像我们想学习如何烹饪新东西时一样?这是一种能力,需要我们上面列出的所有组件,而且对于强化学习也很重要。现在,你只需通过举一个例子,就可以训练你的机器来做你想做的事情,就像我们人类一样!


强化学习 - 这是深度神经网络研究的丰碑:教机器如何学习在一个环境中行动(现实的世界)!这需要自学,持续学习,预测能力,还有更多我们不知道的东西。在强化学习领域有很多工作要做,但是只是研究了其表层的工作。我们已经在这里讨论过了。


  • https://towardsdatascience.com/learning-and-performing-in-the-real-world-7e53eb46d9c3

 

强化学习通常被称为“蛋糕上的樱桃”,意思是它只是在一个人造大脑的顶部进行的小训练。但是,我们怎样才能获得一个“通用”的大脑,然后轻松地解决所有问题呢?这是一个鸡生蛋的问题!今天,我们用标准神经网络来解决强化学习的问题:


  • 一种深度神经网络,它接收大量的数据输入,如视频或音频,并将其压缩为表示


  • 一个序列学习神经网络,如RNN,用来学习任务



这两个组件都是解决该问题的方案,目前来看显然是错误的,但是每个人都使用这两个组件,因为它们是可用的组件。因为这样的结果是不起眼的:我们可以从头开始学习玩电子游戏,并掌握像国际象棋和围棋这类完全可观察的游戏。但是,这对于现实世界中的复杂问题来说是微不足道的。想象一下,如果AI比人类更擅长玩“黎明时分(Horizon Zero Dawn)”,将是什么情景。 


我们想要的是可以像我们人类一样运作的机器。


我们在“链接5”详细介绍了强化学习。它使用一个可以连续操作的预测神经网络和一个联想存储器来存储最近的经验。


  • 链接5

    https://towardsdatascience.com/learning-and-performing-in-the-real-world-7e53eb46d9c3

 

没有递归神经网络 - 递归神经网络(RNN)有缺陷。RNN在并行化训练方面特别糟糕,甚至在特殊定制机器上也很慢,它们是受到内存带宽的限制,而不是计算能力的束缚,请参阅“链接6”了解更多细节。基于注意力的神经网络在训练和部署方面效率更高,速度更快,而且在训练和部署中的可伸缩性受到的影响更小。在神经网络中,Attention有可能彻底改变很多体系架构,但它并没有得到应有的认可。联想记忆和Attention的结合是下一波神经网络发展的核心。


  • 链接6:


    https://medium.com/@culurciello/computation-and-memory-bandwidth-in-deep-neural-networks-16cbac63ebd5

 

Attention能像RNN一样学习序列,并且计算量减少100倍!


基于attention的神经网络将逐渐取代基于RNN的语音识别,并且在一般在强化学习体系架构和人工智能中发展出相应的方法。


在分类神经网络中信息的定位 - 我们已经讨论了如何定位和检测图像和视频中的关键点。这实际上是一个已经解决的问题,它将被嵌入到未来的神经网络架构中。


硬件



 

硬件是深度学习发展的关键因素。2008 - 2012年和近年来深度学习的迅速扩张主要是由于硬件技术的发展:


  • 每台手机都有廉价的图像传感器,可以收集巨大的数据集。


  • GPU可以加速训练深度神经网络。


之前我们已经讨论过硬件。但是我需要讨论最新的情况!过去1 - 2年,机器学习硬件,特别是针对深度神经网络的机器学习硬件兴起,我们叫FWDNXT,在硬件方面有发言权,我们是SnowFlake这个深层神经网络加速器的制造商。


在这个硬件领域有一些公司:例如NVIDIA, Intel,Nervana,Movidius,Bitmain,Cambricon,Cerebras,DeePhi,Google,Graphcore,Groq,Huawei,ARM,Wave Computing。所有的这些公司都正在开发定制可以训练和运行深度神经网络的高性能微芯片。


关键是要在处理神经网络时,保证最低的功率和最高的性能,而不是像很多硬件所强调的每秒可以进行多少次的理论操作。


但很少有人了解硬件如何真正改变机器学习、神经网络和人工智能。很少有人了解微芯片的重要性以及如何开发这些芯片。


下面是我们的清单:


训练或推断?许多公司正在开发微芯片,以用于神经网络的训练。这是为了从NVIDIA手中分一杯羹,NVIDIA公司是迄今为止的真正做训练硬件的公司。但是,训练是深度神经网络的一小部分。对于每个训练步骤,在实际应用中都有一百万次部署。例如,您现在可以在云上使用目标检测神经网络:这样的神经网络曾经在很多图像集上训练过,但是一旦训练完毕,它就可以被数以百万计的数百万台计算机使用。我们在这里想说的是:训练硬件的重要性显得微不足道。而制作一个芯片组需要额外的硬件和技巧,因此训练硬件并不像许多人想象的那么重要。


应用程序 - 可以提供更快速、更低功耗的训练服务的硬件是非常重要的,因为它可以更快地创建和测试新的模型和应用程序。但最重要的一步是将硬件用于应用程序。今天有很多应用程序是不切实际的,其实是硬件的原因而不是软件效率低下。例如,我们的电话可以基于语音助理,但是由于不能始终运行,语音助理显得并没有那么重要。就连家庭助理也要和供电问题联系起来,除非我们在家里放置多个麦克风,否则它是不能一直跟着我们的。也许最大的应用还是将手机屏幕从我们的生活中移除,并将其嵌入到我们的视觉系统中。然而没有超高效的硬件,所有这些应用以及其他的应用(小型机器人)将不可能实现。


赢家和输家 - 在硬件上,赢家将是那些能够用最低能耗处理工作,并且迅速投入市场的产品。 想象一下在手机中的SoC,经常会迭代升级,现在想象一下将神经网络加速器嵌入到存储器中。这一举措可能会快速征服大部分市场,并且有着显著的渗透率。 这就是我们所说的胜利者。

 

关于神经神经网络硬件,参见下面链接。

  • https://towardsdatascience.com/neuromorphic-and-spiking-or-not-894a836dc3b3

 

 

应用




我们在上文简要介绍了应用程序,在这里进行详细介绍。 人工智能和神经网络如何进入我们的日常生活?

下面是清单:


1)图像和视频分类 - 已经在许多云服务中提供。神经网络硬件将允许移除云服务并且在本地处理越来越多的数据:它保护了隐私并且节省互联网带宽。


2) 基于语音的助理 – 语音助理正成为我们生活的一部分,因为可以在我们的“智能”家庭中播放音乐和控制其他设备。基于语言的助理正在越来越好地为我们服务。 但是它们仍然与电网联系在一起。 我们想要的真正助手是能够与我们一起移动的。 我们的手机似乎可以胜任, 那么硬件又可以大显身手了,因为它可以为智能手机提供这种功能。利用智能手机, Alexa和Cortana和Siri将永远在线,你的手机也很快成为你的智能家居助手。当我们在城市里走动时,我们也希望在我们的车里提供本地语音处理能力。更多地使用硬件处理、更少地使用云服务,将保证隐私和节省带宽成本。


3)真正的人工助手 – 虽然语音助手是伟大的,但我们真正想要的是能看见我们身边的实物、分析周边环境的助手。这才是真正的AI助手。神经网络硬件可以帮助你实现这个愿景,因为分析视频源的计算量非常大,目前处于硅硬件的理论极限。 也就是说,真正的AI助手比语言助手要困难得多。 但并不是不可能,像AiPoly这样的许多智能创业公司已经拥有了所有的软件,但缺乏能在手机上运行的强大硬件。还要注意,用可穿戴的眼镜设备替换手机屏幕真的会成为我们的助手,成为我们的一部分!

 

4)烹饪机器人 - 下一个最大的电器将是烹饪和清洁机器人。这个方向很快就会有相应的硬件,但是我们显然缺乏相应的软件。 我们需要迁移学习、持续学习和强化学习。每个食谱都是不同的,每中烹饪配料也是不同的。 我们不能硬编码所有的项,我们需要一个可以学习和推广的综合实体来做到这一点。就目前的发展速度而言,还有好几年的时间。


原文链接:

https://towardsdatascience.com/artificial-intelligence-ai-in-2018-and-beyond-e06f05167f9c

-END-

专 · 知

人工智能领域主题知识资料查看获取【专知荟萃】人工智能领域26个主题知识资料全集(入门/进阶/论文/综述/视频/专家等)

同时欢迎各位用户进行专知投稿,详情请点击

诚邀】专知诚挚邀请各位专业者加入AI创作者计划了解使用专知!

请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料

请扫一扫如下二维码关注我们的公众号,获取人工智能的专业知识!

请加专知小助手微信(Rancho_Fang),加入专知主题人工智能群交流!

点击“阅读原文”,使用专知

展开全文
Top
微信扫码咨询专知VIP会员