AI的下一个战场：认知智能的突围

会员服务 ·

AI的下一个战场：认知智能的突围

2020 年 1 月 20 日 AI科技评论

作者 | 蒋宝尚

编辑 | Camel

“深度学习的钥匙丢在了黑暗角落。”张钹院士不止一次提出这个论点。

深度学习方法易受欺骗、易受攻击已经是研究者们达成的共识，追其根本原因，张钹归结为：大家只是在灯亮的方向对模型修修补补，没有向人类深入学习。

更为具体的是：没有在数据驱动的基础上引进知识，没有改变深度学习网络的模型与结构。

图片来自AI TIM E 第十期

对人工智能发展的三个阶段进行剖析：1.计算智能；2.感知智能；3.认知智能。显然，2019年是在第二阶段渡过的，在2019年，我们进一步研究语音识别，计算机人脸的识别，以及想方设法让计算机加强语言文字处理能力。但是，对于第三阶段，让人工智能真正的进行理解，进行思考，进行推理还尚未触及到门槛。

“当前的人工智能很多的研究，并不在于理解，是一个非常表象的匹配。”清华大学黄民烈在AI Time 第十期学术论坛中提到，“当前的感知智能实际上是涉及机器的视觉、听觉和触觉感知的能力，主要是对深数据的处理，能做一些分类、检测，然后基于这些再做初步的决策，特点是数据驱动，是一种典型的弱人工智能的范畴。”

这也就是说深度学习技术的确是推动了感知智能技术的快速发展，但是仅仅依靠深度学习技术是远远不够的，深度学习是纯粹基于数据的方法，属于归纳的范畴，并不具有可解释性。从感知智能走向认知智能，仅仅依靠深度学习是远远不够的，还需要有更多突破。

所以，从感知智能走向认知智能必须把相关研究放在认知层面，即将研究方向聚焦于人的语言、认知和逻辑相关方面，打造具有归纳的能力，有推理的能力，有知识运用的能力的强人工智能。

认知智能的获取，AI研究的瓶颈

感知智能和认知智能是人类的两个不同的性质，无法对这两个行为进行孰高孰低的评价。张钹院士认为人类的智能实际上是三个内容，分别是感知智能、理性行为、人类的一些行为动作，这三个内容加起来才是认知智能。

在感知方面，最大的问题是无法从感性的认识提高到理性，也就是说目前深度学习几乎达不到从感性上升到理性。

然而推理在攻克人工智能项目难题时非常重要，例如交互视觉的相关研究中，如果场景中有镜子，呈现的场景是虚像，当前的深度学习算法无法有效处理，这时候便需要推理。在医学影像中，如果如果两根血管离的非常近，深度学习很容易把两个并在一起，准确区分则需要进行推理。

让机器获得推理能力，就要让机器做一个“人类”，模仿人脑思考的方式，建立新的神经网络结构，赋予其足够的表达力。

正如阿里巴巴的杨红霞在AI Time第10期中谈到：“小朋友观看一次狗的图片，就能认识到狗这个物种，但是机器需要训练成千上万张图片才不会犯错误；对于一只狗眼睛，人可能下意识的感知到这是一只狗的眼睛，机器可能会因为信息不充分判断失败”。

所以，用少量的信息得到最好的效果，也是机器获得认识智能的一个表现。

将数据和知识结合获得认知是学界达成共识的一个方法，但是知识获很困难，将数据和知识结合更加困难。

让AI获得知识的知识库在业界称为“知识图谱”，它不仅要关注知识点还要关注知识点间的关联。这些关联将赋予AI联想力。提到水，它要反映到密度、透明等多个性质联系起来，更高级的是计算出用多大力道去取水。

知识图谱的建立非常困难，人类海量的知识如何翻译成机器的语言，并与之建立联系，很成问题。尤其是之前这项工作一直是人工完成的，例如谷歌词库、百度百科、维基百科等都可以转换为知识图谱，但工作量大、内容异常庞杂。

幸好，有一些思路为我们提供了参考，例如图神经网络在对图节点之间依赖关系进行建模的强大功能，使得与图分析相关的研究领域取得了突破；从人脑中借助的注意力机制、记忆、遗忘也很好的改变了现有的神经网络结构，设计动态神经网络，根据外界的输入，改变自身的结构和参数。

正如达摩院2020十大科技趋势预测中的那样，人工智能会从感知智能向认知智能演进。人工智能已经在“听、说、看”等感知智能领域已经达到或超越了人类水准，但在需要外部知识、逻辑推理或者领域迁移的认知智能领域还处于初级阶段。认知智能将从认知心理学、脑科学及人类社会历史中汲取灵感，并结合跨领域知识图谱、因果推理、持续学习等技术，建立稳定获取和表达知识的有效机制，让知识能够被机器理解和运用，实现从感知智能到认知智能的关键突破。

获取和表达知识重要的是有高效的学习系统，那么现在的学习系统，应该怎么样去积累，去获得知识呢？

模拟人类大脑，构建机器学习系统

观察人类的进化角度、发展的角度，从而让机器学习这种角度是一个非常好的路径，但是具体实施确是非常个困难。关于学习系统，张钹院士在AI Time 学术论坛中提到：“对于人脑来说，其实从神经元的表述来讲，差别并不大，一个非常重要的原因，人类的大脑连接的很少，提供了非常灵活的学习机会，人类最大的优势就在于脑容量越大，但是都是不确定的，全是靠出生10多年不断的产生连接，所以这属于非常灵活的结构。

这也就是说，学习知识的能力，并不是取决于神经网络已有的固定连接。

人工智能的最终解决要依靠我们对大脑的工作有深入的了解，对大脑理解越多，对如何构建学习系统就会更加清晰。正如张钹院士提到的那样，目前我们对大脑的了解，在细胞这个量级上面，所有的重大问题都清楚，人脑细胞的重大问题基本上都解决了，但是这些知识对人工智能几乎没有什么用处，因为已解决的问题太细节了，太底层了，无法直接运用。真正对人工智能有用就是网络，解决人脑的回路问题才是重点，然而现在在脑回路方面的研究非常粗浅。

现在的尝试主要基于类脑计算，依靠神经科学家和数学家。而早期的类脑计算（也可以狭义的称为神经计算），将神经元和突触模型作为基础，把这些模型用在许多现实中的识别任务，从而发挥模拟人脑功能，例如字体识别，人脸识别等等。

脑建模则是在认知脑的基础上进行的，目前的类脑计算算法还有很大的研究价值，目前发现的生物学机制只有少部分使用了计算神经学的方式进行模拟，被用在类脑计算中的机制则更加有限。另外，计算机仿真工具和数学的理论分析仍然不够完善，类脑计算没有形成统一的理论框架，面对大数据时代还没办法取代深度学习等成熟算法和工具的地位。

参考文献

https://baijiahao.baidu.com/s?id=1637178297338822067&wfr=spider&for=pc