张首晟:AI与区块链共生,让丑小鸭变白天鹅

2018 年 3 月 26 日 笔记侠 张首晟


内容来源:2018年3月25日下午,美国斯坦福大学讲座教授、中国科学院外籍院士张首晟在2018中国(深圳)IT领袖峰会上发表了题为《量子计算、人工智能与区块链》的演讲。


  图片 | Holly  责编 | 苏文炳

 第 2095篇深度好文:4950字 | 7分钟阅读

完整笔记·区块链


本文新鲜度:★★    口感:蟠桃


笔记君邀您,先思考:


  • 人工智能面临的瓶颈是什么?

  • 区块链如何帮助区块链突破瓶颈?

在张首晟看来,人工智能的发展空间巨大,区块链与人工智能的共生,会创造无限的可能性。

 

人工智能现在最缺少的是数据,恰恰数据现在是处在被中心机构垄断的一种状态里,不能帮助机器合理地学习,从这种意义上看,人工智能是有所欠缺的。

 

区块链可以给人工智能提供一个去中心化的数据市场,并对数据提供者提供正确的激励机制,真正使我们的社会变得公平。

 

基于人工智能和区块链的共生,他说:“人工智能可依赖这个数据市场起飞。”

 

以下,enjoy:


一、人工智能:数据是“智慧”的基础

 

人工智能是一个基本概念,60年代就已经被提出来。今天之所以人工智能能够有突飞猛进的发展,主要原因是三大的潮流的汇总。

 

根据摩尔定律,人工智能的计算能力每过18个月能够翻倍;如果按照量子计算的理论,计算能力就不只是18个月翻倍,而是完全从量变到质变的。

 

一方面是我们的计算能力在不断增长;另一方面,随着互联网和物联网的发展,产生大量的大数据,这些大数据能够帮助机器实现真正学习(因为再好的算法,再强的计算机,如果没有数据的话,也不能成为最佳的人工智能)


另外还有智能算法的发现,并且已经有突飞猛进的变化。

 

然而,虽然人工智能在突飞猛进的发展、改变,但是仍处在非常早期的阶段,而且今后的前景非常广阔。

 


为什么这么讲呢?做一个简单的类比:

 

我们曾经看到鸟飞,于是也非常想飞,但是人类早期学习飞行,只是简单的仿生,我们只是在自己的手臂上绑上翅膀。

 

人类真正实现飞行的原因,是因为我们理解了飞行的第一性原理:空气动力学。基于数学原理、数学方程,我们就可以人为设计最佳的飞行方式。于是我们看到,现在的飞机飞得又高、又快,但是它并不像鸟,这是非常核心的一点。

 

可能现在人工智能,也是在简单地模仿人的神经元。我们更应该思考,是否有一个基础科学重大突破的机会,通过数学原理,让我们真正去理解智慧和智能的基本原理,这样真正能够使人工智能有突飞猛进的变化。



大家经常会问:到底用什么样的判据能够真正衡量人工智能达到了人的标准?

 

大家可能听说过图灵测试,图灵测试就是人与机器对话,我们不知道对方到底是人还是机器。整个对话的过程中,如果花了一天的时间根本判断不出来,那就说明机器人好像已经达到人的水平。

 

笔记君注:图灵测试是指测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。


进行多次测试后,如果有超过30%的测试者不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。


但是,我并不赞同图灵测试这个判决。因为人类是一个进化的过程,很多情感并不是理性的情感,要让一个理性的机器学一个非理性的人类大脑,可能并不是那么容易。比如你可能故意激怒机器人的话,说不定它也不怎么会理你。

 

那如何判断机器真正超越了人的智力?我想提出一个新的判据:

 

人类最伟大的一点,就是我们能够做科学的发现。所以最好的判据就是:哪一天机器人真能够做科学的发现,能比人类更好地做出科学发现,那一天机器就超过人类了。

 

在化学里面最伟大的发现就是元素周期表。假定我们根本不知道元素周期表这件事情,而机器是否可以在没有任何辅导的情况下,自己发现元素周期表?

 

比如,我们仅仅输入所有存在的化学元素的名字,结果机器自然地发现了元素周期表,它可以做出人类认为伟大的科学发现。

 

再比如,可以帮助我们发现新药,用机器学习的办法发现新的材料等等。那人工智能就是真正超越了人类的智力。

 

二、区块链:去中心化的数据市场

 

人工智能虽然在突飞猛进的发展,但目前最缺的核心部分就是数据,恰恰今天数据是处在完全中心垄断的状态里面,不能帮助机器合理地学习。

 

前不久,媒体曝光Facebook上很多用户的个人数据被盗,数据在没有被用户允许下使用。我们很清楚,在今天的世界,每个人会产生出很多的数据,比如:个人的基因数据、医疗数据、教育数据、行为数据等等。

 

但问题是:这些数据都是掌握在中心机构里面,没有达到真正的去中心化。

 


而区块链,就能够实现一个去中心化的数据市场。所以我理想的世界是:未来每人拥有自己所有的数据,是完全去中心化的储存,黑客也不可能黑每个人的数据。

 

然后用一些加密的算法在区块链上,真正能够达到既保护个人的隐私,又能够做出良好的计算。

 

所以我把今后区块链的理念用一句话来描写——“In Math we trust”(我们的信念建筑在数学上)。



这张表大家应该记得,未来某一天,它肯定会成为整个区块链和整个IT领域里面的基础。

 

它既是最基础的数学,又能在数据市场里面保护个人的隐私,也能够做出合理的统计性计算。



比如有一种非常神奇的计算方法叫零知识证明,它能够向你证明我的数据是非常有价值的,但是又不告诉你真正隐私的数据在哪。

 

笔记君注:零知识证明是指证明者能够在不向验证者提供任何有用的信息的情况下,使验证者相信某个论断是正确的。

 

有了区块链和数据市场的产生,我们能够真正使社会变得更加公平。我们现在最大的不公平是我们容易歧视一些少数派,但是在机器学习的过程中,最需要的就是少数派所拥有的数据。

 

如果今天机器学习的精准率达到90%了,还要使90%达到99%,那机器需要的不是已经学过的数据,而是跟以前最不一样的数据。这些往往是少数派拥有的数据,所以对机器学习来讲是最有价值的。

 

所以,一旦我们建筑在区块链的基础上,再加上这些奇妙的数学算法之后,我们就能够真正达到去中心化的数据市场,而少数派所拥有的数据是最可贵的。

 

这样我们就真正能够把一个丑小鸭变成一个美天鹅,因为丑小鸭并不是丑,只是跟别人不一样而已。

 

在这个世界里面,真正达成区块链和人工智能互相共存,它们一定是最有价值的。

 


另外,我们对区块链的认识,还不是最根本的第一性原理的认识。用最基本的物理学原理来讲,达到共识就是大家都同意同一个账本,相当于在物理学里面,磁铁本来是杂乱无章的,但是到了铁磁态里面,它们指向的方向是一样的。

 

所以达到共识在自然世界里是有的,在人文世界里也是有的,这种现象是叫熵减的现象,即达到共识。


当大家都朝一个方向时,这个状态的熵是远远比杂乱无章的熵要小。(笔记君注:熵可以简单理解为一个系统“内在的混乱程度”。)

 

要达到共识是非常难的,因为熵总是在增的,要把它减下来是很难的事情。在区块链上能达到一个共识系统,是用了一种算法,在这上面是需要消耗能量的。

 

大家可能一开始不太理解,为什么一些账户要耗费能量?但是从物理学第二定理来讲,这是非常合理的一件事情。


因为达到共识本身就是熵减,但整个世界的熵一定要增加,所以在达到共识的同时一定要把另外一些熵排除出去。

 

这种没有中心化的机制,跟自然世界里面的磁铁从杂乱无章的状态达到有序的铁磁状态非常相像,所以,要付出代价也是必然的趋势。

 

三、量子计算:人工智能优化的根本


很多有意思的科学发现,都跟哲学观念的改变有关联。这一点在中华民族的古老哲学上已经体现出来:


世界是正负对立的世界观,有正数必有负数,有存款必有贷款,有阴必有阳,有善必有恶,有天使必有魔鬼。



这种对立的世界观在基本粒子的物理世界里面也有一种呈现。

 

曾经有一位非常伟大的理论物理学家狄拉克(他跟爱因斯坦、杨振宁是我认为20世纪做出最伟大贡献的三位物理学家),他要把爱因斯坦的狭义相对论和量子力学统一起来。

 

在统一的过程中,他要做一个非常简单的数学运算——开一个根号。因为在开根号的时候始终会出现正负两个解,一般人可能只关心正解,不关心负解,而狄拉克很聪明,他把负解解释成所有的粒子必然有反粒子。

 

这个是非常惊人的预言,因为1928年的时候,并没有发现有反粒子现象,所以大家都对他提出非常大的质疑,说他这个方程肯定不对,在世界上肯定没有反粒子。但他说:“我的方程实在是太美了,你们继续去寻找。”

 

过了5年,果然在宇宙辐射的射线里面,大家找到了电子的反粒子,命名为狄拉克海。从此之后,质子找到了反质子,中子也找到了反中子。

 

正电子在医疗领域里面已经有广泛的应用,有一种医疗测试叫PET(正电子发射型计算机断层显像,是核医学领域比较先进的临床检查影像技术)就是用正电子和负电子产生成像,比如我们要测阿兹海默症,最好的办法就是做PET。

 

但是,这些跟今天的IT峰会有什么关系?IT峰会最关心的是计算机,目前计算机已经分成两类,有经典计算机和量子计算机。

 

有些问题经典计算机很容易可以解决,比如把两个大的数乘起来,经典计算机可以算得很快。但是一个数能不能拆成另外两个数的乘积?比如15可以写成3乘以5。

 

这个数比较小的话,我们自己可以算出来,但给你一个很大的数,经典的计算机要算这个数到底是不是两个数的乘积,需要花很长的时间。


因为它用的算法是穷举法,要把所有可能被除的数一个个除过来,最后才能确认这到底是不是两个数的乘积,所以经典计算机算起来是非常慢的。

 

笔记君注:穷举法的基本思想是根据题目的部分条件确定答案的大致范围,并在此范围内对所有可能的情况逐一验证,直到全部情况验证完毕。

 

若某个情况验证符合题目的全部条件,则为本问题的一个解;若全部情况验证后都不符合题目的全部条件,则本题无解。

而人工智能要做的事情,要把整个人类所有计算的事情,最终能转化为优化的问题,这里很多的可能性,但我们要找到最佳的可能性,如果用经典计算机的穷举法,最后只能算出一个答案。

 

但量子世界是非常神奇的世界,它是平行的世界,比如有一个著名的试验:


如果我放出一个粒子,它有两个孔,要不是左边,要不是右边。打一个炮弹过去的话,要不就是从左边穿过,要不就是从右边穿过,不可能同一个时间既穿过左边,又穿过右边。

 

但是量子世界有一种本真的平行在里面,一个基本粒子在某一个瞬间可以同时穿过两个孔,只有这种行为才能解释在后面形成的干扰条纹。


 

假定要么是左,要么是右的话,呈现的图像就不是这个图像。因为量子的世界本身就是平行的,如果用量子世界来做计算的话,就能够达到秒算,把所有的可能性一下子算出来,这是量子计算最基本的概念。

要真正造出这个量子计算机是非常困难的。经典计算机最基本的单位是比特,意味着信息不是0就是1,用0、1就能够表达所有的信息,这是经典计算机的概念。

 

但是在量子世界里面,一个粒子同时穿过左孔,又穿过右孔,处在某一种叠加的状态。一个量子比特讲不请到底是0还是1,它是处在0和1叠加的状态里面。

 

这是一种非常奇妙的现象,但正是由于这种现象,说明了一个量子的比特本身是不太稳定的,任何一个噪声就会对量子比特都会产生很大的干扰。

 

最近量子计算机成为全球很多著名公司特别关注的领域,谷歌、微软、IBM、因特尔都在做投资,但是根本上不能解决这个问题——一个量子比特是非常不稳定的。

 

一个有用的比特,在量子计算的框架下往往需要10个、20个甚至40个、50个纠错的比特来为它服务,这就使得量子计算很难真正实现。

 

最后我想说,我们整个世界科学是最无止境、没有国界的,今天我们所要解决的人工智能、量子计算都是整个人类的问题。所以我们一定不要把眼光放在局部,而是放眼整个全球和整个世界。

 

在这个过程中,中国是一个非常大的机遇,大家都想回答的问题:我们中国除了把应用科技做得好,能不能在中国有真正原创科技的产生?

 

我今天跟大家介绍的这些都是基本的物理和数学原理,听起来可能比较抽象,比如熵增原理、正负电子等,但这正是我们这个世界的奇妙支出,它能够给整个IT行业提供最基本的科学技术发展的前景。

 

谢谢大家。



笔记侠的小伙伴,大家好~

我们现在新开了一个号:


「区块笔记侠(ID:AiNotesman)


如果你想先人一步,

加入区块链的世界,

那就去关注「区块笔记侠」吧~

现在扫码关注

笔记侠好文推荐:


万字解读《区块链革命》:区块链经济七大设计原则

龚焱:区块链离第一个拐点“断崖式下跌”已经非常近了

雷军:接下来的一年,连睡觉都觉得浪费时间

李嘉诚今日宣布退休,重温其90年来的独特思维!


登录查看更多
0

相关内容

区块链(Blockchain)是由节点参与的分布式数据库系统,它的特点是不可更改,不可伪造,也可以将其理解为账簿系统(ledger)。它是比特币的一个重要概念,完整比特币区块链的副本,记录了其代币(token)的每一笔交易。通过这些信息,我们可以找到每一个地址,在历史上任何一点所拥有的价值。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
新时期我国信息技术产业的发展
专知会员服务
70+阅读 · 2020年1月18日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
2019中国硬科技发展白皮书 193页
专知会员服务
82+阅读 · 2019年12月13日
资源|Blockchain区块链中文资源阅读列表
专知会员服务
43+阅读 · 2019年11月20日
5G全产业链发展分析报告
行业研究报告
11+阅读 · 2019年6月7日
人工智能在教育领域的应用探析
MOOC
12+阅读 · 2019年3月16日
国内高校人工智能教育现状如何?
大数据技术
9+阅读 · 2018年4月24日
2018年中国人工智能行业研究报告
艾瑞咨询
3+阅读 · 2018年4月2日
PPTV创始人姚欣:人工智能到底怎么赚钱?
【精华版】2017年区块链干货合集
FinTech前哨
4+阅读 · 2018年1月11日
Arxiv
5+阅读 · 2020年3月26日
Arxiv
14+阅读 · 2020年1月27日
Heterogeneous Deep Graph Infomax
Arxiv
12+阅读 · 2019年11月19日
Meta-Learning to Cluster
Arxiv
17+阅读 · 2019年10月30日
Adaptive Neural Trees
Arxiv
4+阅读 · 2018年12月10日
Arxiv
9+阅读 · 2018年10月24日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Neural Architecture Optimization
Arxiv
8+阅读 · 2018年9月5日
VIP会员
相关VIP内容
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
德勤:2020技术趋势报告,120页pdf
专知会员服务
190+阅读 · 2020年3月31日
新时期我国信息技术产业的发展
专知会员服务
70+阅读 · 2020年1月18日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
2019中国硬科技发展白皮书 193页
专知会员服务
82+阅读 · 2019年12月13日
资源|Blockchain区块链中文资源阅读列表
专知会员服务
43+阅读 · 2019年11月20日
相关资讯
5G全产业链发展分析报告
行业研究报告
11+阅读 · 2019年6月7日
人工智能在教育领域的应用探析
MOOC
12+阅读 · 2019年3月16日
国内高校人工智能教育现状如何?
大数据技术
9+阅读 · 2018年4月24日
2018年中国人工智能行业研究报告
艾瑞咨询
3+阅读 · 2018年4月2日
PPTV创始人姚欣:人工智能到底怎么赚钱?
【精华版】2017年区块链干货合集
FinTech前哨
4+阅读 · 2018年1月11日
相关论文
Arxiv
5+阅读 · 2020年3月26日
Arxiv
14+阅读 · 2020年1月27日
Heterogeneous Deep Graph Infomax
Arxiv
12+阅读 · 2019年11月19日
Meta-Learning to Cluster
Arxiv
17+阅读 · 2019年10月30日
Adaptive Neural Trees
Arxiv
4+阅读 · 2018年12月10日
Arxiv
9+阅读 · 2018年10月24日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Neural Architecture Optimization
Arxiv
8+阅读 · 2018年9月5日
Top
微信扫码咨询专知VIP会员