本文转载自人机与认知实验室公众号,来源:《学术前沿》杂志第10期下
摘 要 本文首先探讨了现有人工智能科技的发展状况,分析了联结主义、行为主义、符号主义的缺点和不足,进而指出约束智能科学发展的瓶颈所在;其次对智能科学系统中的数据/信息表征、认知模型的构建优缺点进行了概况分析;最后指出人机智能融合系统是未来智能科学的主要发展趋势。
关键词 人机;融合;智能;思考
《三国演义》第一回:“话说天下大势,分久必合,合久必分”。自然科学中的诸多学科之大势也莫不如此,当人类经历了数百年的学科精分细化之后,目前随着人工智能的快速发展,许多学科正在慢慢交叉融合起来。在经历了三次起伏(即上世纪70年代后期对数学定理证明非万能的清醒、90年代后期对专家系统与五代机的失望、2006年深度学习掀起了新一轮的浪潮),人们狂热的希望逐渐踏实了很多,目光和注意力也慢慢地从痴迷科幻转移到了一个崭新而又富有活力的领域:人机融合智能领域。
一、现有人工智能的不足
从历史上看,人工智能大概分三大门派,一是以模仿大脑皮层神经网络及神经网络间的连接机制与学习算法的联结主义(Connectionism),主要表现为深度学习方法,即用多隐层的处理结构处理各种大数据;二是以模仿人或生物个体、群体控制行为功能及感知-动作型控制系统的行为主义(Actionism),主要表现为具有奖惩控制机制的强化学习方法,即通过行为增强或减弱的反馈来实现输出规划的表征。三是以物理符号系统(即符号操作系统)具有产生智能行为的充分必要条件假设(Newell and Simon,1976)和有限理性原理为代表的符号主义(Symbolicism),主要表现为知识图谱应用体系,即用模拟大脑的逻辑结构来加工处理各种信息和知识。正是由于这三种人工智能派别的取长补短,再结合蒙特卡洛算法(两种随机算法中的一种,如果问题要求在有限采样内,必须给出一个解,但不要求是最优解,那就要用蒙特卡罗算法。反之,如果问题要求必须给出最优解,但对采样没有限制,那就要用拉斯维加斯算法。)使得特定领域的人工智能系统超过人类的智能成为了可能,如IBM的Waston问答系统和Google Deepmind的AlphaGo围棋系统等。尽管这些人工智能系统取得了骄人的绩效,但仍有不少缺陷和不足之处,而且还有可能产生很大的隐患和危险。
首先先分析一下让人工智能在当下火热烫手的联结主义。当前的人工智能之所以高烧不退,其主要的力量源泉是2006年Hinton提出的深度学习方法大大提高了图像识别、语音识别等方面的效率,并在无人驾驶、“智慧+”某些产业中切实体现出助力作用。然而,任何一种算法都有其不完备性,深度学习算法也不例外。该方法的局限性和不足是最好使用在具有可微分(函数连续)、强监督(样本数据标定很好、样本类别/属性/评价目标恒定)学习、封闭静态系统(干扰少、鲁棒性好、不复杂)任务下,而对于不可微分、弱监督学习(样本分布偏移大、新类别多、属性退化严重、目标多样)、开放动态环境下该方法效果较差,计算收敛性不好。另外,相对于其他机器学习方法,使用深度学习生成的模型非常难以解释。这些模型可能有许多层和上千个节点;单独解释每一个是不可能的。数据科学家通过度量它们的预测结果来评估深度学习模型,但模型架构本身是个“黑盒”。它有可能会让你在不知不觉间,失去“发现错误”的机会。再者,如今的深度学习技术还有另一个问题,它需要大量的数据作为训练基础,而训练所得的结果却难以应用到其他问题上。如何在各种现实情境任务中恰如其分地解决这些问题,就需要结合其他的方法取长补短、协调配合。
其次,对于行为主义中的增强学习,它的优点是能够根据交互作用中的得失进行学习绩效的累积,与人类真实的学习机制相似。该方法最主要的缺点是把人的行为过程看的太过简单,实验中往往只是测量简单的奖惩反馈过程,有些结论不能迁移到现实生活中,所以往往外部效度不高。还有,行为主义锐意研究可以观察的行为,但是由于它的主张过于极端,不研究心理的内部结构和过程,否定意识的重要性,进而将意识与行为对立起来,进而限制了人工智能的纵深发展。
最后是符号主义及其知识图谱,符号主义属于现代人工智能范畴,基于逻辑推理的智能模拟方法模拟人的智能行为。该方法的实质就是模拟人的大脑抽象逻辑思维,通过研究人类认知系统的功能机理,用某种符号来描述人类的认知过程,并把这种符号输入到能处理符号的计算机中,就可以模拟人类的认知过程,从而实现人工智能。可以把符号主义的思想简单的归结为“认知即计算”。从符号主义的观点来看,知识是信息的一种形式,是构成智能的基础,知识表示、知识推理、知识运用是人工智能的核心,知识可用符号表示,认知就是符号的处理过程,推理就是采用启发式知识及启发式搜索对问题求解的过程,而推理过程又可以用某种形式化的语言来描述,因而有可能建立起基于知识的人类智能和机器智能的同一理论体系。目前知识图谱领域面临的主要挑战问题包括:1.知识的自动获取;2.多源知识的自动融合;3.面向知识的表示学习;4.知识推理与应用。符号主义主张用逻辑方法来建立人工智能的统一理论体系,但却遇到了“常识”问题的障碍,以及不确知事物的知识表示和问题求解等难题,因此,受到其他学派的批评与否定。
从上述人工智能三大流派的特点及缺点分析,我们不难看出:人的思维很难在人工智能现有的理论框架中得到解释。那该如何做才有可能寻找到一条通往智能科学研究光明前程之道呢?下面我们将针对这个问题展开最底层的思考和讨论。
二、约束智能科学发展的瓶颈是什么
人工智能之父图灵的朋友和老师维特根斯坦在他著名的《逻辑哲学论》第一句就写道:“世界是事实的总和而非事物的总和”,其中的事实指的是事物之间的关涉联系——关系,而事物是指包含的各种属性,从目前人工智能技术的发展态势而言,绝大多数都是在做识别事物属性方面的工作,如语音、图像、位置、速度等等,而涉及到事物之间的各种关系层面的工作还很少,但是已经开始做了,如大数据挖掘等。在这眼花缭乱的人工智能技术中,人们常常思考着这样一个问题:什么是智能?智能的定义究竟是什么呢?
关于智能的定义,有人说是非存在的有,有人说是得意忘形,有人说是随机应变,有人说是鲁棒适应,有人说……,可能有一百个专家,就有一百种说法。实际上现在要形成一个大家都能接受的定义是不太可能的。但是这并不影响大家对智能研究中的一些难点、热点达成一致看法或共识。比如信息表征、逻辑推理和自主决策等方面。
一般而言,任何智能都是从数据输入开始的,对人而言数据就是各种刺激(眼耳鼻舌身),对机器而言数据就是各种传感器采集到的各种数据,数据是相对客观的,而从中提炼出有价值的数据—信息就是相对主观的,信息已经开始带有人的价值观、偏好倾向和风俗习惯。人机处理数据最大的差异在于形成信息的表征,机器中的数据常常是结构化归一量化后的“标准数据”,数据表征的符号就是0、1或其他进制的数字;人采集到的数据则是各种非结构化、非一致性不同量纲种类的刺激输入,其表征方式是极其灵活多变的,对一朵花、一棵树甚至可以有无限多种表征,正可谓是“一花一世界、一树一菩提”,而且表征出的信息符号是由“能指”和“所指”构成的,“能指”指具体的物理刺激形象,“所指”指信息所反映的事物的概念及拓扑关系。比如,对于一杯水,机器可能表征它为高度、宽度、密度、颜色等客观数值参数,而人除此之外,还可以把它表征为热情、友谊、问候、送客等方面的多维内涵外延拓展,这种千差万别的混合指向变化,机器无论如何是表征不出的、处理不了的……所以,从智能的源头就可以找到人工智能与人类智能的根本区别之所在。数据的变化与动态映射是感知的瓶颈,人会期望性的补偿或回望性的修正,而机器就是把过去性(数据)当成当下来处理,若数据处于过程中不敏感还好些,若是临界性数据,就常常会差之毫厘谬以千里了…数据、信息、知识、逻辑本质上就是事物之间不同程度的关系表征,这种表征可以体现在人的记忆和直觉之间,也可以显示于机器的存储与计算之中。只不过机器数据的单一表征从一开始就异于人的多种刺激融合,这也是机器不能产生类人意向性的主要原因:缺乏灵活的一多分有(内涵外延伸张弥聚有度自如)的表征机制。
有人认为符号化和对象化可能是两个不同的步骤。一个对象可以没有符号名字,也可以有多个符号名字,一个符号可以表示多个不同对象。智能的理解要做到符号到对象的指向性,没有做到指向性,只是符号间关系的处理,不能算理解。实际上对人而言感与知往往是同步的,在形成习惯风俗后,对象与符号应该也是融合的。
有了数据和信息之后,智能的信息处理架构就格外的重要,到目前为止,有不少大家提出了一些经典的理论或模型,例如在视觉领域,David Marr的三层结构至今仍未许多智能科技工作者所追捧。作为视觉计算理论的创始人Marr认为:神经系统所作的信息处理与机器相似。视觉是一种复杂的信息处理任务,目的是要把握对我们有用的外部世界的各种情况,并把它们表达出来。这种任务必须在三个不同的水平上来理解,这就是:a.计算理论 b.算法 c.机制(见下表)。
表 David Marr计算视觉的三层结构
计算理论 |
算法 |
机制 |
信息处理问题的定义,它的解就是计算的目标。这种计算的抽象性质的特征。在可见世界内找出这些性质,构成这个问题的约束条件。 |
为完成期望进行的计算所采用的算法的研究。 |
完成算法的物理实体,它由给定的硬件系统构成.机器硬件的构架。 |
Marr早先提出的一些基本概念在计算理论这一级水平上已经成为一种几乎是尽善尽美的理论。这一理论的特征就是它力图使人的视觉信息处理研究变得越来越严密,从而使它成为一门真正的科学。
当前,在解释人类认知过程工作机理的理论中,由卡耐基梅隆大学教授John Robert Anderson提出的ACT-R(Adaptive Control of Thought–Rational ,ACT-R)模型被认为是非常具有前途的一个理论。该理论模型认为人类的认知过程需要四种不同的模块参与,即目标模块、视觉模块、动作模块和描述性知识模块。每一个模块各自独立工作,并且由一个中央产生系统协调。ACT-R的核心是描述性知识模块和中央产生系统。描述性知识模块存储了个体所积累的长期不变的认识,包括基本的事实(例如“西雅图是美国的一座城市”)、专业知识(例如“高速铁路交通信号控制方案的设计方法”)等。中央产生式系统存储了个体的程序性知识,这些知识以条件-动作(产生式)规则的形式呈现,当满足一定条件时,相应的动作将被对应的模块执行,产生式规则的不断触发能够保证各个模块相互配合,模拟个体做出的连续认知过程。ACT-R是一种认知架构,用以仿真并理解人的认知的理论。ACT-R试图理解人类如何组织知识和产生智能行为。ACT-R的目标是使系统能够执行人类的各种认知任务,如捕获人的感知、思想和行为。
无论是David Marr的三层结构计算视觉理论,还是John Robert Anderson提出的ACT-R理论模型,以及许多解释和模拟人类认知过程的模型都存在一个共同的缺点和不足,即不能把人的主观参数和机器/环境中的客观参数有机地统一起来,模型的弹性不足,很难主动地产生鲁棒性的适应性,更不要说产生情感、意识等更高层次的表征和演化。当前的人工智能与人相比除了在输入表征和融合处理方面的局限外,在更基本的哲学层面就存在这先天不足,即回答不了休谟问题。
休谟问题是指英国哲学家大卫.休谟(David Hume)1711年在《人性论》的第一卷和《人类理智研究》里面提出来的。首先提出的,是个未能很好解决的哲学问题,主要是指因果问题和归纳问题,即所谓从“是”(being)能否推出“应该”(should),也即“事实”命题能否推导出“价值”命题。休谟指出,由因果推理获得的知识,构成了人类生活所依赖的绝大部分知识。这个由休谟对因果关系的普遍、必然性进行反思所提出的问题被康德称为“休谟问题”。休谟问题表面上是一个著名的哲学难题,实际上更是一个人工智能的瓶颈和难点,当把数据表征为信息时,能指就是相对客观表示being,而所指就是主观表达should。
从认识论角度,“应该”就是从描述事物状态与特征的参量(或变量)的众多数值中取其最大值或极大值,“是”就是从描述事物状态与特征的参量(或变量 )的众多数值中取其任意值。 从价值论角度,“应该”就是从描述事物的价值状态与价值特征的众多参量(或变量)中取其最大值或极大值,“是”就是从描述事物价值是状态与价值特征的参量(或变量)的众多数值中取去其任意值。
由于受偏好习惯风俗等因素的影响,即使是人类的认识论和价值论也经常出现非因果归纳和演绎(比如严格意义上而言,从“天行健”这个事实(being)命题是不能推出“君子必自强不息”这个价值观(should)命题的,但是随着时间的延续,这个类比习惯渐渐变成了有些因果的意味。)。人工智能的优势不仅在于存储量大计算速度快,更重要的是它还可以从源头没有偏见的头脑和认知封闭,但是要处理类似虽是由人类提出的但仍远远不能完美回答的休谟问题恐怕还是强机所难吧!人工智能如果有一定的智能,恐怕更多的应是数字逻辑语言智能,在特定场景既定规则和统计又既定输出的任务下可以极大提升工作效率,但在有情感、有意向性的复杂情境下仍难以无中生有、随机应变。未来智能科学的发展趋势必将会是人机智能的不断融合促进。
三、未来是人机智能的融合
人机融合智能,简单地说就是充分利用人和机器的长处形成一种新的智能形式。
英国首相丘吉尔曾经说过:“你能看到多远的过去,你就能看到多远的未来”,所以我们有必要看看人机智能融合的过去。任何新的事物都有其产生的源泉,人机融合智能也不例外,人机融合智能主要起源于人机交互和智能科学这两个领域,而这两个领域起源都与英国剑桥大学有着密切的关系:1940年夏,当德国轰炸机飞向伦敦之际,人机交互与智能科学的研究序幕就被徐徐拉开了…英国人为了抵御德国人的进攻,开始了雷达、飞机、密码破译方面的科技应用工作,当时在剑桥大学圣约翰学院建立了第一个研究人机交互问题的飞机座舱(即著名的Cambridge Cockpit)以解决飞行员们执行飞行任务时出现的一些错误和失误,另外剑桥国王学院的毕业生图灵领导了对德军“恩尼格玛”密电文的破译…事实上,早在19世纪,剑桥大学的查尔斯.巴贝奇和阿达.奥古斯塔(剑桥大学毕业生、诗人拜伦的女儿,世界第一位程序员)就开始合作机械计算机软硬件的研制,20世纪之后,数学家罗素、逻辑学家维特根斯坦(图灵的老师和朋友)都对智能科学的起源和发展做出了重大的贡献。当前人机智能融合领域比较火的两位深度学习之父辛顿曾是剑桥大学心理系的学生、阿尔法狗之父哈撒比斯本科是剑桥计算机系毕业的……
在人机智能融合时,有一件事非常重要,就是这个人要能够理解机器如何看待世界,并在机器的限制内有效地进行决策。反之,机器也应对配合的人比较“熟悉”,就像一些体育活动中的双打队友一样,如果彼此间没有默契,想产生化学变化般的合适融合、精确协同就是天方夜谭。有效地人机智能融合常常意味着将人的思想带给机器,这也就意味着: 人将开始有意识地思考他通常无意识地执行的任务;机器将开始处理合作者个性化的习惯和偏好;两者都还必须随时随地地随环境的变化而变化……高山流水,电脑与心灵相互感应,充分发挥两者的优点和长处,如人类可以打破逻辑运用直觉思维进行决策、机器能够检测人类感觉无法检测到的信号能力等等。人类所理解的每一个命题,都必定是全然是由我们所获知的各种成分所组成的。意识是一种对隐显关系的梳理,有时表现为直觉。
人的直觉是同化、顺应之间的自由转换,能够灵活自如地进行不完全归纳和弹性演绎,更重要的是: 这一切都是由内而外的自主行为。直觉经验本质上是一种感性,一种自动意识性关联和得意忘形。直觉是把存在性、可能性、意向性、潜在性勾兑显化的一种方式,也是把零碎、散化的数据信息知识非常逻辑表征,其中的粘合剂就是情感(机器所不具备的能力)-一种独特的智能--情智,直觉本质上就是通情达理,能够隐约看见许多通过理性逻辑看不到的关系、联系,从而把许多平时风马牛不相及的属性、成分(包括主观臆想客观存在)关联在一起形成某种意向性的可能存在。而机器更适合于分类聚类,利用人类部分可以描述化、程序化的形式语言实现强监督学习、构建认知模型、辅助决策等方面。当前,人机之间的理解都是单向性的,之间的学习也是,只不过逐渐开始出现了双向性的苗头,人机之间开始理解一些以前认为不含理解成分的对象和事物,慢慢把人的主动性与机的被动性有效地混合起来。人处理其擅长的包含“应该”(should)等价值取向的主观信息,机器则计算其拿手的涉及“是”(being)等规则概率统计的客观数据,进而把休谟之问变成了一个可执行可操作的程序性问题,也是把客观数据与主观信息统一起来的新机制,即需要意向性价值的时候由人来处理,需要形式化(数字化)的事实时候由机器来分担,从而产生了一种人+机大于人、人+机大于机的效果。
人机智能融合中深度态势感知是一个重要隘口,深度态势感知含义是“对态势感知的感知,是一种人机智慧,既包括了人的智慧,也融合了机器的智能(人工智能)”, 是能指+所指,既涉及事物的属性(能指、感觉)又关联它们之间的关系(所指、知觉),既能够理解事物原本之意,也能够明白弦外之音。它是在以Endsley为主体的态势感知(包括信息输入、处理、输出环节)基础上,加上人、机(物)、环境(自然、社会)及其相互关系的整体系统趋势分析,具有“软/硬”两种调节反馈机制;既包括自组织、自适应,也包括他组织、互适应;既包括局部的定量计算预测,也包括全局的定性算计评估,是一种具有自主、自动弥聚效应的信息修正、补偿的期望-选择-预测-控制体系。
相比起人工智能来,我们更愿意谈人机融合智能,也许人工智能更偏应用和技术,谈人机融合智能则可以更基础一些。另外,需要注意的是,人机融合智能本身不仅仅是科学问题,还涉及到其他学科,如人文艺术、哲学,甚至还有宗教神学。还有,智能不是人类独有的能力,还关涉其他生命体,比如动物、植物等,那么究竟什么是智能呢?美国第一届心理学会主席威廉.詹姆斯说的一句话或许可见一斑:“智慧是一种忽略的艺术。”
单纯的计算应该是没有大的突破,认知+计算可能是未来。如果把认知看成美女,计算视作野兽,未来的智能科学就是美女与野兽,而数据则是美女牵着野兽的缰绳。要把这样的机遇变成现实,就需要与目前AI研究方向不同的新的研究课题,比如需要探索认知科学对于人类与动物如何学习与推理的研究,将其与计算科学结合,整合成最终能以人类的方式工作的系统。Being与should的狭义结合就是数据与知识、结构与功能、感知与推理、直觉与逻辑、联接与符号、属性与关系的结合,也是未来智能体系的发展趋势…其广义结合是意向性与形式化、美女与野兽的结合。人工智能的美女派主要抓关系产生的关系,野兽派主要抓属性产生的关系。临界,这是一种介于有序和无序之间的状态,是工作效率最大化的一种表现形式。人机融合智能就是要寻找到这种平衡状态,让人的无序与机的有序、人的有序与机的无序相得益彰,达到安全、高效、敏捷的结果。
既然我们很多时候无从得知因果之间的关系,只能得知某些事物总是会连结在一起。那么我们有什么理由从对个别事例的观察中引出普遍性的结论呢?想象力、创造力是感性与理性的界面,也许人机智能的融合可以实现一定程度上主客观、感性与理性的相互适应性融合吧!
转载自慧影Cydow(ID:hyCydow),作者:谢耘博士,首都科技领军人才,清华大学电子工程系博士
任何事物只有放在它所存在的环境中,才能准确理解它的本质。今天,大数据、人工智能等概念由于商业炒作等多方面的原因,已经变得模糊不清了。许多具体的技术也被罩上了夺目的光环,或有意被赋予了能够引发奇妙想象的名字,如“深度学习”。
下面,我们来看一下信息技术产业中的不同要素,在从科学到应用的这个链条上,各自处于什么样的位置。为了不陷入不必要的细节而又能揭示本质,我们将这个链条分为五个环节:科学原理,基础共性技术,具体应用技术,基础系统原理/技术及具体应用系统,见图1。
图1 从科学原理到应用系统
科学原理是对基本运动规律的认识总结,而技术是对规律的运用。所以新的科学原理的提出,常常会对社会产生深刻而广泛的影响。正因为科学原理的意义如此之大,所以“科学”也常常被盗用。许多技术性的产出,也被带上了“科学”这个帽子。在计算机领域,图灵机与计算复杂性理论基本上属于科学原理这个范畴。也正因为如此,计算机才被冠以了“科学”的称谓。
从根本上看,人工智能热潮在90年代的冷却,是因为人们在人工智能领域经过了几十年的努力,没有能够理解一般意义上的智能过程的本质,因而也就没有能够取得科学意义上的原理性突破,在理论上抽象出类似数字基本计算那样的基本智能操作,用以支撑更为高级复杂的智能过程。所以人工智能领域的产出,虽然丰富而且影响巨大,但是却始终没有达到科学原理的高度。
在一个产业中,会有一些基础性共性技术,有时也被成为核心技术,它们支撑着整个产业。在信息技术产业中,操作系统、数据库、集成电路等就属于这个层面的技术。这些技术的进步,对整个产业的影响也是全局性的。正是集成电路技术的进步,促成了2010年前后整个信息技术产业发生了历史性的转折(见《转折---眺望IT巅峰》第二章第三节)。人工智能领域不仅没有科学原理层面的成果,而且至今也没有能够产生支撑一个产业的基础共性技术,不论我们给那些技术/方法起个什么样的名字。
在基础共性技术之上,还有面向不同问题的具体应用技术去解决不同类型的问题。在这个层面,我们才遇到了人工智能的踪影。如我们在《转折---眺望IT峰》一书第八章第二节中所述:“当人们意识到我们没有能力用一些普适的基本逻辑化规则或机制去有效地解决各种‘智能问题’时,人工智能的研究便扎入到了各种具体的问题之中。针对不同类型的问题,发展出了花样繁多的解决方法,也取得了很大的进展。……. 也正因为如此,人工智能目前更多地是被当成了一些具体的应用工具方法,融入到了不同类型的应用之中,以自己具体的技术性名称出现,默默无闻地发挥着自己的作用。这些年关于人工智能的一本经典的教科书的名字是‘人工智能---一种现代方法’,……它的副标题‘A Modern Approach’就是指试图采用‘智能体’(Agent)的概念将人工智能在各个不同领域中的方法整合到一个统一的框架之中。”其实,用智能体这个概念整合与人工智能相关的技术方法,也是没有办法的办法,显示出了这个领域的一种无奈的现实:只有实用的一些具体技术方法,缺少科学原理或基础共性技术的支撑,也没有基础性系统级的有效理论。这些年被热捧的“深度学习”,也是这个层面的技术。
“深度学习”这个概念包括了深度信念网络、卷积神经网络、循环与递归网络等多种不同的具体网络模型与相应的算法,用来解决不同类型的问题。它们实际上是借助计算机的“暴力”计算能力,用大规模的、含有高达千万以上的可调参数的非线性人工神经网络,使用特定的“学习/训练”算法,通过对大量样本的统计处理,调整这些参数,实现非线性拟合(变换),从而实现对输入数据特征的提取与后续的分类等功能。它是解决特定类型问题的一些具体的方法,而不是具有像人那样的一般意义上的学习的能力,尽管这个名字确实引发了许多不了解这个技术的人的这方面的想象。其实,信息技术领域内的绝大部分技术,基本都属于这个层面,包括与大数据相关的技术,而且它们也都属于辅助智能性质的技术。所以,大数据、人工智能与其它的技术彼此的界限日益模糊。
这些具体的实用性技术,包括“深度学习”(人工神经网络),常常是实验性技术,在应用于一个新的具体问题之前,我们无法确定它是否能够有效地解决这个问题,或者能够将问题解决到什么程度。
正因为如此,以深度学习为例,在《深度学习》(【美】伊恩·古德费洛等著,MIT Press出版,2016年)这本被认为是“深度学习”领域奠基性的经典教材中,作者为了阐述深度学习的这种实验性特征,专门设置第11章来讨论这个问题,它的题目取为“实践方法论”。在这一章的开头,作者写了这样一段话:“要成功地使用深度学习技术,仅仅知道存在哪些算法和解释它们为何有效的原理是不够的。一个优秀的机器学习实践者还需要知道如何针对具体应用挑选一个合适的算法以及如何监控,并根据实验反馈改进机器学习系统。在机器学习系统的日常开发中,实践者需要决定是否收集更多的数据、增加或减少模型容量、添加或删除正则化项、改进模型的优化、改进模型的近似推断或调整模型的软件实现。尝试这些操作都需要大量时间,因此确定正确的做法而不盲目猜测尤为重要。”这段话比较完整地揭示了深度学习这个具体技术的实验性特征。
人工智能的这种状态多少有点像传统领域在现代科学出现以前,人们通过经验摸索,也能够设计制造出很多不同类型的精巧工具来解决各种具体的问题的状况。而具体的实用技术再丰富精妙,也未必能够产生出更深一层的原理性、普适性的成果。中国历史上无数的能工巧匠都没有能够让中国赶上现代科技发展的潮流,就说明了这个问题。
以上各层的产出,都还不能直接服务于人。所以在它们之上,还有把技术变成实用产品/系统的原理与技术。在此为了简便我们只分了两层。特别需要指出的是,由于人工智能等技术属于具体应用技术,而不是系统级技术,所以事实上它们自己无法成为构造实际应用系统/产品的基础,而必须依附于系统级原理与相关技术才能发挥作用。虽然当初有过主要基于人工智能技术构造系统的努力,比如日本的第五代计算机,今后这种努力也不会完全消失。但是,从人工智能技术的客观本质来看,将其作为具体层面的应用技术来使用,才是合理的选择。
对底层技术发挥自身价值起决定性作用的,是基础系统原理及相关的技术。比如冯诺依曼架构就属于这个范畴。它之所以成为了计算机领域的核心成就,就是因为这个架构使得我们能够利用相关的具体技术设计制造出实际可以使用的计算机系统产品,借助计算机系统产品让相关的具体技术在各个领域里发挥出自己应有的价值。
这一层的基础系统原理及相关的技术与具体的应用领域相对独立,所以其影响也是全局性的。它们不仅包括了独立基础性系统的原理与相关系技术,还包括了大量独立系统之间的交互链接组成更宏观的基础性大系统的原理与相关技术。互联网、云计算就属于这个类别。在网络化的信息技术领域,组成宏观大系统的原理与技术在起到日益重要的作用。当然独立基础性系统的创新,是大规模互联系统的前提,其作用更为基础。
这一层基础系统原理与相关技术层面的创新的重要性,远远超过了那些具体应用技术,至少可以与基础共性技术比肩,有些甚至接近科学原理。所以冯诺依曼架构在计算机领域才有了如此崇高的地位。而人脑的强大功能,不仅仅体现在具体的智力能力上,还体现在它的系统层面。这种系统层面的优势,在本章第一节中我们用实例指出,它不仅仅是在于大量神经元之间的分布式联接而形成的高度分布的网络,在下一节我们还会从另外一个方面分析人脑在系统层面的一个重要的、没有被充分重视的特征。
同属于这个层面的除了互联网,云计算以外还有最近备受关注的“区块链”。2009年伴随比特币出现的区块链技术,最能说明系统层面的突破,如何能够让下层具体的应用技术发挥出最大的价值了。
2008年11月,一个自称为“中本聪”的匿名人士在互联网上发表了一篇简短但影响重大的文章:“Bitcoin: A Peer-to-Peer Electronic Cash System”(比特币:一个对等网络上的现金系统)。2009年1月3日,中本聪自己在比特币系统里建立了第一个区块(创世块),由区块链支撑的比特币系统开始运转,区块链技术正式登场。该技术的示意见图2。
图2 区块链示意
仔细研究区块链中的具体技术我们就会发现,区块链所使用的解决具体问题的技术,如非对称加密,防篡改,对等网络等等,都是现有的技术,没有任何一个是中本聪发明或改进过的。仅仅使用这些现成的技术,中本聪却创造出了一个在开放互联网上分布式运行、不用监管、人人可以参与记账、账目公开透明,同时又是可信、可靠、安全、精准无误的现金系统。如果说虽然至今还没有基本的可行性,但是无数人依然在向往创造出与人有着同样智能,甚至超越人的智能化系统的话,一个这样的现金系统在被创造出来之前,可以说基本任何人都没有想到过要去实现这个目标,也不会相信有人能够把它创造出来。这是一个建立在现有信息具体技术之上、超出了所有人想象的信息技术奇迹。
这个奇迹依靠的不是解决具体问题的技术的新突破,而是一个创新的系统性原理与设计。中本聪充分利用了分布式开放网络环境下人的行为特征,巧妙地创造出了可以运行在开放的互联网上的基于区块链的分布式系统。比特币中保证账务记录准确无误的所谓“共识算法”,正是这个分布式系统的系统级运行机制的一部分。或者说共识算法是通过分布式系统的系统级运行机制的设计而实现的。区块链技术之所以难以被准确把握与理解,就在于它的许多本质的特性是由系统级机制决定的,而不是依靠单点技术来实现。
不论区块链的技术未来会有什么样的应用,它的出现本身都给我们带来了非常深刻的启示。
首先,它让我们在信息技术产业中看到了一个活生生的、利用成熟的具体技术做系统级创新所能够创造出来的、超出所有人想象、超出了具体技术所能够达到的、奇迹般的颠覆性效果。系统的重要性,在上个世纪八十年代就被高度重视了。当时在科技界有着著名的三论之说,即信息论,控制论与系统论。对系统论的高度重视,是对近代科技发展历程认识深化的结果。钱学森做出的最重要的一个历史性贡献,就是把系统论的观点与方法深深地植入了中国的许多领域,特别是航天领域。
在传统的产业中我们也能看到大量的系统性创新对具体技术的超越。我们简单看一下航空工业的例子。早期的飞机所采用的动力是活塞发动机。后来在上个世纪三十年代末,德国率先将喷气式飞机送上了天。随后涡轮喷气发动机成为了航空动力的主角。这两种发动机在科学原理上是相同的,都是利用燃料燃烧导致气体膨胀而将热能转化为机械能。但是两者的系统级原理却完全不同。涡轮喷气发动机是航空动力系统的一次基础性系统级颠覆式创新。它所带来的进步,不是塞发动机在任何具体层面的技术或材料的改进所能够比拟的。它给航空产业带来了天翻地覆的变化。
图3 活塞发动机与涡轮喷气发动机
在今天的军事领域,决定战场优势的也不再仅仅是具体兵器在传统意义上的先进性,而是海陆空天一体化的超级系统。这是当代战争一个质的飞跃。
其次,面对区块链带来的令人瞠目的结果,我们不仅要发问:在信息技术产业开启了其黄金时代的大门之后,是否有会有更多的、超出我们想象的、基于系统级的创新不断出现,从而对人类社会的各个领域产生颠覆式的影响?相比于区块链创造的奇迹,我们把自己的想象集中于工具智能的提高上,虽然很有道理,但视野可能过于偏狭了。目前区块链的奇迹与比较复杂的智能技术没有太多的直接联系,更不是对人的智能活动的重复或模仿,但却有惊人的颠覆性冲击。当然,如果区块链在未来得到广泛应用,各种具体的智能技术融入其中也是必然的趋势。
在当今信息技术产业的热点中,与大数据和人工智能相比,由于它的专业性区块链是一个相对寂寞的技术。但正是它,给我们打开了一扇独特的观察信息技术产业未来发展的窗户,提供了一个独特的视角,它所揭示的潜在可能,对我们有效地把握信息技术产业乃至整个人类文明的未来发展或许具有更本质而重要的意义。
当前信息技术应用系统越来越多地成为了软件的设计,而正如我们在《转折—眺望IT巅峰》第二章第一节中指出的那样,“与实物产品的设计开发相比,软件开发几乎是在一个无限资源的虚拟空间里的随意发挥。以至于软件设计开发甚至被认为是一种纯精神化的艺术创作过程。”正是这种随意创作的自由,才出现了区块链的奇迹,也将催生更多的、超出我们今天最浪漫的想象边界的、各种不同系统规模的颠覆性系统级创新。许多系统将要实现的功能在整体上将远远超出今天我们对人工智能的期待,它们不会拥有人这样的主体地位,但是在功效上却会极大地超越人在智能上作为一个个体的所能达到的高度与广度——就像辅助体能的机械性工具在体能的各个方面实现的对人的全面超越。而这些系统所具有的“智能”在性质上将会与人的智能有重大区别,正如区块链系统展示给我们的那样。这些系统正在被逐步创造出来,并将形成一个空前复杂的虚拟世界。
在充分重视人工智能等具体应用技术的进展与带来的冲击的同时,我们应该展开我们的想象,更加重视基础系统级原理及相关技术的创新。信息技术产业发展的未来,可能更多地由这个层面的颠覆式创新所决定。而人工智能等具体的技术,将在这些创新中,找到更好的、更大的发挥舞台。
人工智能赛博物理操作系统
AI-CPS OS
“人工智能赛博物理操作系统”(新一代技术+商业操作系统“AI-CPS OS”:云计算+大数据+物联网+区块链+人工智能)分支用来的今天,企业领导者必须了解如何将“技术”全面渗入整个公司、产品等“商业”场景中,利用AI-CPS OS形成数字化+智能化力量,实现行业的重新布局、企业的重新构建和自我的焕然新生。
AI-CPS OS的真正价值并不来自构成技术或功能,而是要以一种传递独特竞争优势的方式将自动化+信息化、智造+产品+服务和数据+分析一体化,这种整合方式能够释放新的业务和运营模式。如果不能实现跨功能的更大规模融合,没有颠覆现状的意愿,这些将不可能实现。
领导者无法依靠某种单一战略方法来应对多维度的数字化变革。面对新一代技术+商业操作系统AI-CPS OS颠覆性的数字化+智能化力量,领导者必须在行业、企业与个人这三个层面都保持领先地位:
重新行业布局:你的世界观要怎样改变才算足够?你必须对行业典范进行怎样的反思?
重新构建企业:你的企业需要做出什么样的变化?你准备如何重新定义你的公司?
重新打造自己:你需要成为怎样的人?要重塑自己并在数字化+智能化时代保有领先地位,你必须如何去做?
AI-CPS OS是数字化智能化创新平台,设计思路是将大数据、物联网、区块链和人工智能等无缝整合在云端,可以帮助企业将创新成果融入自身业务体系,实现各个前沿技术在云端的优势协同。AI-CPS OS形成的数字化+智能化力量与行业、企业及个人三个层面的交叉,形成了领导力模式,使数字化融入到领导者所在企业与领导方式的核心位置:
精细:这种力量能够使人在更加真实、细致的层面观察与感知现实世界和数字化世界正在发生的一切,进而理解和更加精细地进行产品个性化控制、微观业务场景事件和结果控制。
智能:模型随着时间(数据)的变化而变化,整个系统就具备了智能(自学习)的能力。
高效:企业需要建立实时或者准实时的数据采集传输、模型预测和响应决策能力,这样智能就从批量性、阶段性的行为变成一个可以实时触达的行为。
不确定性:数字化变更颠覆和改变了领导者曾经仰仗的思维方式、结构和实践经验,其结果就是形成了复合不确定性这种颠覆性力量。主要的不确定性蕴含于三个领域:技术、文化、制度。
边界模糊:数字世界与现实世界的不断融合成CPS不仅让人们所知行业的核心产品、经济学定理和可能性都产生了变化,还模糊了不同行业间的界限。这种效应正在向生态系统、企业、客户、产品快速蔓延。
AI-CPS OS形成的数字化+智能化力量通过三个方式激发经济增长:
创造虚拟劳动力,承担需要适应性和敏捷性的复杂任务,即“智能自动化”,以区别于传统的自动化解决方案;
对现有劳动力和实物资产进行有利的补充和提升,提高资本效率;
人工智能的普及,将推动多行业的相关创新,开辟崭新的经济增长空间。
给决策制定者和商业领袖的建议:
超越自动化,开启新创新模式:利用具有自主学习和自我控制能力的动态机器智能,为企业创造新商机;
迎接新一代信息技术,迎接人工智能:无缝整合人类智慧与机器智能,重新
评估未来的知识和技能类型;
制定道德规范:切实为人工智能生态系统制定道德准则,并在智能机器的开
发过程中确定更加明晰的标准和最佳实践;
重视再分配效应:对人工智能可能带来的冲击做好准备,制定战略帮助面临
较高失业风险的人群;
开发数字化+智能化企业所需新能力:员工团队需要积极掌握判断、沟通及想象力和创造力等人类所特有的重要能力。对于中国企业来说,创造兼具包容性和多样性的文化也非常重要。
子曰:“君子和而不同,小人同而不和。” 《论语·子路》云计算、大数据、物联网、区块链和 人工智能,像君子一般融合,一起体现科技就是生产力。
如果说上一次哥伦布地理大发现,拓展的是人类的物理空间。那么这一次地理大发现,拓展的就是人们的数字空间。在数学空间,建立新的商业文明,从而发现新的创富模式,为人类社会带来新的财富空间。云计算,大数据、物联网和区块链,是进入这个数字空间的船,而人工智能就是那船上的帆,哥伦布之帆!
新一代技术+商业的人工智能赛博物理操作系统AI-CPS OS作为新一轮产业变革的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎。重构生产、分配、交换、消费等经济活动各环节,形成从宏观到微观各领域的智能化新需求,催生新技术、新产品、新产业、新业态、新模式。引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。
产业智能官 AI-CPS
用“人工智能赛博物理操作系统”(新一代技术+商业操作系统“AI-CPS OS”:云计算+大数据+物联网+区块链+人工智能),在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的认知计算和机器智能;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。
长按上方二维码关注微信公众号: AI-CPS,更多信息回复:
新技术:“云计算”、“大数据”、“物联网”、“区块链”、“人工智能”;新产业:“智能制造”、“智能农业”、“智能金融”、“智能零售”、“智能城市”、“智能驾驶”;新模式:“财富空间”、“特色小镇”、“赛博物理”、“供应链金融”。
点击“阅读原文”,访问AI-CPS OS官网
本文系“产业智能官”(公众号ID:AI-CPS)收集整理,转载请注明出处!
版权声明:由产业智能官(公众号ID:AI-CPS)推荐的文章,除非确实无法确认,我们都会注明作者和来源。部分文章推送时未能与原作者取得联系。若涉及版权问题,烦请原作者联系我们,与您共同协商解决。联系、投稿邮箱:erp_vip@hotmail.com