不可否认的是,AI 和区块链是促进创新和给每个行业带来根本性转变的两大技术。每种技术都有其技术上的复杂度和商业意义,但是两者的联合使用也许能够从零开始重新设计整个技术产业(和人类社会)。
本文想要简单介绍下人工智能和区块链技术融合使用时的一些潜力,以及讨论下相关的标准定义、面临的挑战、这样做的好处以及在该领域一些有意思的玩家。
我已经写了一段时间关于人工智能的文章,所以在这里我就不浪费时间来介绍什么是什么不是人工智能了。但是,至今为止我还没有写过关于区块链和电子加密货币方面的文章,所以在这第一个章节我会先介绍下区块链是什么以及它的工作原理。
区块链是 一种安全的分布式的不可变的数据库,在分布式网络中由所有人共享。在数据库中,交易数据可以被记录(在链上的基本信息,或者在链外附加的附件)并且易于审计。
区块链是一种安全的分布式的不可变的数据库,在分布式网络中由所有人共享。
简而言之(用英格兰银行的话来说),区块链就是“让不相识的人相互信任所共享事件记录的一种技术”。
数据存储在称为 块(block)的刚性结构中,这些结构通过 hash 在链中相互连接(每个块也含有一个时间戳(timestamp)和一个链接,能够通过其 hash 连接到前一个块)。每个块会有自己的标题,标题中包括元数据(metadata)和真实的交易数据。由于每个区块都与前一个区块相连,随着参与人数和区块数量的增加,在没有网络共识的情况下修改任何的信息都是非常困难的。
网络可以通过不同的机制来验证交易,但主要还是通过“工作量证明(proof-of-work)”或“权益证明(proof-of-stake)”来进行验证的。工作量证明(Nakamoto,2008)要求参与者(称为“矿工(miner)”)解决复杂的数学问题来增加一个块,这又需要大量的能源和硬件能力来解码。权益证明(Vasin,2014)则试图通过将更多挖矿权利分配到拥有更多虚拟货币的参与者那里,来解决这个能源效率问题(这类证明存在多种变体,而且有一些人质疑它著名的“权益粉碎”问题)。
其他的机制有拜占庭容错算法(Byzantine-fault-tolerant algorithm,Castro 和 Liskov,2002),Quorum slicing(Mazieres,2016)以及权益证明(Mingxiao 等,2017)的变体,但是在这里我们就不一一讨论了。
需要说明的最后一个特点是基于不同网络访问权限的区块链的类别,即是否任何人都可以自由地查看(无需许可 permissionless 或需要许可 permissioned)或者参与共识的达成(公共或私人)。在前一种情况下,任何人都可以访问、读取或写入帐本中的数据,而在后一种情况下,只有预定的参与者有权加入网络(当然是在公共无需许可的情况下,针对矿工的奖励制度建立起来的) 。
到现在这种技术的基本情况就清楚了,这不仅仅是一种破坏性创新,而是一个旨在“改变中介范畴”的基础技术(Catalini and Gans,2017)。
分布式账本技术的确会降低验证和联网的成本,影响现有市场的结构,并最终允许新市场的创建。Iansiti 和 Lakhani(2017)在最近的一个工作(我强烈推荐)中也提出了区块链和 TCP / IP 之间的一个良好的平行关系,说明区块链是如何缓慢地经历了四个阶段,来识别 TCP / IP 等先前的基础技术,即单次使用阶段,本地化使用阶段,替代阶段和转换阶段。
正如他们解释的那样,这种技术的“新颖性”使得人们很难去理解解决方案的相关领域,而其“复杂性”则需要更大的制度变革来促进这项科技的简单使用。
然而,不可否认的一点是,区块链也正在改变着传统商业模式,以相反的方式进行着价值的分配:在十五年前投资于应用程序比投资协议技术更加合理,但是在区块链的世界里,价值绝大部分都集中在共享的协议层,只有极少量是在应用程序层面(参见 Joel Monegro 的“Fat Protocol”理论)。
区块链是一个“肥”协议而“瘦”应用的堆栈 (Joel Monegro).
作为这个介绍性章节的结束,我还简单想说下的是区块链的可能性不止是在交易上,而且还在于能够创建由特定事件和阈值触发的(智能)合约,并且可以不费力地对此进行追踪和审计。
现在围绕着区块链的一大炒作是 ICOs 这一新的现象。即使现在很多人因为 ICO 与最常见的(和有价值的)首次公开募股(IPOs)相似而向其中投入了大量资金,但是 ICO 只不过是一种代币销售(token sale),其中一个代币是特定网络(或应用程序)中最小的功能单元。
ICOs 的专家(如果有的话)请原谅我的笼统定义,但是 ICO 是一个混合的概念,包含了股票分配、预售 / 众筹活动,以及具有有限的权力和应用程序域的货币等多种元素。
引进一种新的没有管制的方式来集资,毫无疑问是一个很有意思的创新,但是这也给毫无准备的社区带来了几个问题。我很高兴收到关于这方面的反馈意见,但在这里,我会提炼一下 ICO 评估的几个关键点:
代币除了具有价值交换的功能外,还具有额外的效用。如果公司只是出于筹集资金的目的出售代币,会向市场发出一个不好的信号。代币是创建基础用户群时所需要的,能够在最早期的时候鼓励利益相关者参与到整个生态圈里来。光是一份好的白皮书是不够的。
要警惕没有管制的代币销售
要警惕没有时间限制的代币销售
要警惕没有清楚声明(现在和将来)代币数量和价值的代币销售(这听起来很荒谬,但是 ICO 的不透明度或许会让你吃惊。)
尽管区块链的功能很强大,但也有其局限性。一些是技术上的,一些是从老式金融服务板块继承而来的固有的老旧思想,但是这些局限性均能以某种方式受到 AI 的影响:
能源消耗:挖矿(mining)是一个极为困难的任务,需要大量的能源(还有金钱)来完成 (O’Dwyer and David Malone, 2014)。AI 已经被证明能够高效率的完成对能源的有效利用,所以我相信同样的结果也能在区块链上实现。由此可以降低在挖矿硬件上所需要的投资。
可伸缩性:区块链正在以每 10 分钟 1MB 的速度稳步增长,现已累计达 85GB。中本聪(2008)首次提出了“区块链精简”(即为了不用将整个区块链都存储在单个笔记本电脑中,可以删掉已完成消费交易中不必要的数据),作为存量累积问题的可能解决方案。但是 AI 可以引入去中心化的学习系统比如联合学习(federated learning),或者使用新的数据分片技术(data sharding techniques)来提高系统的效率。
安全:即使区块链几乎不可能被破解,但是它下面的层和应用程序就不是那么的安全了(例如:DAO、Mt Gox、Bitfinex 等)。机器学习在过去两年中所取得的惊人进展,使得 AI 成为保证区块链应用程序部署的绝佳盟友,尤其是在系统结构是固定的情况下。
隐私:拥有个人数据的隐私问题引发了监管和策略上,对于比较优势的考量(Unicredit, 2016)。同态加密(Homomorphic encryption,直接对加密的数据进行处理),比如 Enigma 项目(Zyskind 等,2015)或 Zerocash 项目(Sasson 等,2014)毫无疑问都是潜在的解决方案,但是我认为这个问题跟已经提到的可伸缩性和安全这两个问题是紧密相连的,并且三者将会变得同等重要。
效率: Deloitte (2016) 之前估计在区块链中关于核实和共享交易一年的运营成本会有 6 亿美元。一个智能系统最终有可能计算出在以某个特定节点作为第一个执行某项任务的可能性,降低其他的矿工针对这一交易的投入,从而降低总成本。除此之外,即使存在一些结构上的约束,效率上的提高和能耗上的降低也可能会降低网络延迟(network latency),帮助交易更快地完成。
硬件:矿工(不一定是公司,也有可能是个人)将大量的钱投放进了专门的硬件组件中。因为能耗一直是一个大问题,所以在这个问题上有人们提出了很多的解决方案,未来也会有更多的方案被提出。一旦系统足够的更加高效,一些硬件或许会被转化(有时是部分转化)用于神经网络(挖矿巨头 Bitman 正是这样做的)。
缺少相关人才:这是对原有信仰的跨越,但是我们也同时想要将数据科学本身自动化(就我目前所知的情况,尚未成功),我觉得我们可以通过创造虚拟代理,让代理自己来创造新的账本(甚至是在账本上实现交互,并且能够维护生成的账本)。
数据门槛:在将来我们所有的数据都会在区块链中,而公司能够直接从我们这里购买这些数据。我们将会需要很多方面的帮助,如访问授权、跟踪数据的使用和以计算机的速度弄清楚我们个人信息中的变化等。这是(智能)机器需要去做的事。
在前一章节中,我们简单说了下 AI 最终会对区块链产生的影响。在这一章节,我们将会反过来,尝试去理解区块链会对机器学习系统的发展产生怎样的影响。具体来说,区块链可能会:
帮助 AI 解释自己(并且让我们相信这个解释):AI 存在着难以解释的黑箱问题。清晰的审计跟踪,不仅可以提高数据的可信度,而且也为追溯机器决策过程提供了一条清晰的途径。
提高 AI 的有效性:安全的数据共享就意味着会有更多的数据(和更多训练的数据),然后是更好的模型,更好的执行,更好的结果……然后更好的新的数据。最后一切都会归结到网络效应的重要性。
降低市场准入的门槛:让我们一步步来说。区块链技术可以保障你数据的安全。所以为什么不私人储存你所有的数据和买卖这些数据呢?你或许会这样做。
所以首先,区块链将会 促进创建更加干净和有组织的个人数据。其次,它将允许不同的新市场的出现:比如数据市场(举手之劳,容易做到);模型市场(更加有意思);最终甚至是 AI 市场(可参照 Ben Goertzel 正试图用 SingularityNET 做的东西)。
因此,简单的数据共享和新的市场,以及区块链数据鉴别一起,将会提供更流畅的整合,从而降低小企业进入的门槛,缩小其与科技巨头的竞争优势。降低了进入门槛之后,我们实际上解决了两个问题:提供了更广泛的数据访问和更有效的数据货币化机制。
增加人为的信任:一旦我们的部分任务将由自主虚拟代理管理,拥有清晰的审计跟踪将有助于机器人之间的相互信任(和我们对它们的信任)。最终还会增加机器与机器之间的交互(Outlier Ventures,2017),并且交易也为人们提供了一种安全地共享数据和协调决策的方式,以及实现分布式系统的鲁棒机制(robust mechnism,与群体机器人和多代理的场景高度相关)。Rob May 在他最近的新闻简报中也表达出了类似的概念(强烈建议订他的简报)。
减少灾难性风险的情景:在 DAO 编写的具有特定智能合约的 AI,将会只能执行这些操作(这就局限了动作空间(action space))。
尽管 AI 与区块链技术的交互会带来很多的好处,但是我有一个一直没想明白的问题:
人工智能诞生于开源环境中,数据的多寡是其壁垒。但是随着现在数据的民主化(软件的开),我们如何才能保证 AI 的繁荣和持续的发展呢?我现在唯一的猜测是?人才。
现在有很多做区块链和电子加密货币的初创公司。我个人的话更对做 AI 和区块链交叉板块(有些人也叫它交汇点 convergence)的公司感兴趣,但是显然这样的公司还不是很多。虽然这些公司主要集中在旧金山地区和伦敦,但是纽约、澳洲和中国,以及欧洲的一些国家也有这样的公司。
因为现在这样的公司很少,所以也很难将它们分类。我通常喜欢试图去理解不同组公司在行业中所属的底层模式以及影响 / 应用的类型。但在这种情况下,由于数据量太少,所以我将简单地把它们做如下分类:
去中心化智能:TraneAI(以去中心化的方式训练 AI)、Neureal(点对点 AI 超级计算)、SingularityNET(AI 市场);Neuromation(合成数据集的生成和算法训练平台);AI Blockchain(多应用智能);BurstIQ(医疗数据市场);AtMatrix(去中心化机器人);OpenMined 项目(数据市场,本地机器学习的训练);Synapse.ai(数据和 AI 市场);Dopamine.ai(B2B AI 货币化平台)
语言会话平台:Green Running(家庭能源虚拟助手)、Talla(聊天机器人)、doc.ai(量化生物和医疗保健见解提供)
预测平台:Augur(集体智能)、Sharpe Capital(众包情绪预测)
知识产权:Loci.io(IP 发现和挖掘)
数据溯源:KapeIQ(医疗机构欺诈检测)、Data Quarka(事实核查)、Priops(数据符合性)、Signzy(KYC)
交易:Euklid(比特币投资) EthVentures(数字代币投资)。对于金融领域的其他(理论)应用,见 Lipton(2017)
保险:Mutual.life(P2P 保险)、Inari(普通保险)
杂项:Social Coin(公民奖励制度)、 HealthyTail(宠物分析)、 Crowdz(电子商务)、DeepSee(媒体平台)、ChainMind(网络安全)
对上述提到公司一些零散的观点:
有趣的是,许多 AI- 区块链公司的咨询委员会比本身的团队还要大。这可能是表明二者的融合还没有完全实现的一个早期迹象,相较于我们已知的东西,我们不知道的东西可能更多;
我个人非常高兴看到第一类(去中心化智能)的发展,但是我也看到了语言会话和预测平台以及知识产权方面的巨大发展。我把其他的例子归类为“杂项”,因为我不认为在这个阶段它们代表某些特定的类别,只是试图将 AI 与区块链匹配起来的单个尝试;
这些公司非常难以评估。这些网站往往足够隐晦,所以很难真正地理解他们做什么和是怎么做的(如果你冲区块链透明模式购买的话,显得有些矛盾),而且对于技术的完全理解是需要经过高科技教育才能做到的。
在这个过程中,摆脱炒作的干扰是很困难的,因而人很容易受到愚弄。举个简单的例子:听过 Magos AI 没有?在搜寻本文中用的公司的时候,我发现我读到了由 AI 驱动的预测区块链的平台公司(Wired、Prnewswire 等等),这家公司刚刚做了一个超过 50 万美元的 ICO,这就保证其平台成果的交付。
但是这个网站竟然无法运行——奇怪吧,如果考虑到他们需要在 ICOs 上共享材料或信息。但是,怎么说,网站无法运行这种事有时候也会发生。因为我是在 Wired 上读到过这个公司的信息,所以我就又额外费力的找了找相关的信息,我很想知道更多地了解这家公司。我找到了这个公司的联合创始人,但是最终并没能在 Linkedin 上找他们的资料。
好吧,退一步说,也有人不喜欢社交媒体的,尤其是考虑到这家公司才刚成立,3 个月前还没有任何它存在的迹象。那我们看下队伍里的其他人吧。什么介绍都没有,甚至没有任何可以追溯表明他们之前经历信息(除了写明 CTO 是分析学硕士,但是我没有找到任何证据)。
然后,我又试图从技术层面入手:白皮书、蓝皮书、黄皮书、和其他你说的上来的书。我只找到了对这些书的评价,但是并找不到原文。最后两步:我不觉得我自己是区块链的专家,但是我会读很多相关的文章。
而且我认为我对 AI 方面的知识和行业中正发生的事算是比较了解的。这些人声称他们创建了 5 个不同的神经网络,可以在不同复杂的领域媲美 Libratus (或 DeepStack) 在 Poker 所取得的精确度,但是我重来没听过他们——太奇怪了对吧?
但是或许我可以给他们写个信,约他们见下面,了解下情况。他们的地址是苏黎世的安盛办事处……哈~
经过 5 分钟的研究,我终于谷歌到了两个关键词:“Magos 骗局”。看来这些人是拿钱跑路了。他们可能确实在哪建立了 6 个神经网络,所以敬请关注。
我的观点是,指数成长型的技术很迷人,可以推动人类社会的发展,但随着利益的增加,潜在的“负面融合”也会呈指数级增长。请保持警惕。
区块链和人工智能技术是技术领域的两个极端:一个是在封闭式的数据平台上助长中心化的智能,另一个是在开放数据环境中推动去中心化的应用。但是,如果我们找到一个聪明的方法让它们一起工作,总的积极的外部效应就可以在一瞬间被放大。
当然这两种强大的技术之间的交互会产生技术和伦理上的影响,例如我们如何编辑(甚至遗忘)区块链上的数据? 是可编辑区块链会是解决方案吗?AI- 区块链会不会推动我们成为数据囤积者呢?
老实说,我认为我们唯一能做的就是不断尝试。
Castro, M., Liskov, B. (2002). “Practical Byzantine Fault Tolerance and Proactive Recovery”. ACM Transactions on Computer Systems, 20(4): 398–461.
Catalini, C., Gans, J. S. (2017). “Some Simple Economics of the Blockchain”. MIT Sloan School Working Paper: 5191–16.
Deloitte (2016). “Blockchain Enigma. Paradox. Opportunity”. White Paper.
Iansiti, M., Lakhani, K. R. (2017). “The Truth About Blockchain”. Harvard Business Review, January–February 2017: 118–127.
Lipton, A. (2017). “Blockchains and Distributed Ledgers in Retrospective and Perspective”. arXiv:1703.01505.
Mazieres, D. (2016). “The stellar consensus protocol: A federated model for internet-level consensus”. White Paper.
Mingxiao, D., Xiaofeng, M., Zhe, Z., Xiangwei, W., Qijun, C. (2017). “A Review on Consensus Algorithm of Blockchain”. 2017 IEEE International Conference on Systems, Man, and Cybernetics (SMC) Banff Center, Banff, Canada, October 5–8, 2017
Nakamoto, S. (2008). “Bitcoin: A Peer-to-Peer Electronic Cash System”. White Paper.
O’Dwyer, K. J., Malone, D. (2014). “Bitcoin mining and its energy footprint”. 25th IET Irish Signals & Systems Conference 2014 and 2014 China-Ireland International Conference on Information and Communications Technologies (ISSC 2014/CIICT 2014), Limerick, pp. 280–285.
Outlier Ventures (2017). “Blockchain-Enabled Convergence”. White Paper.
Sasson, E. B., Chiesa, A., Garman, C., Green, M., Miers, I., Tromer, E., Virza, M. (2014). “Zerocash: Decentralized anonymous payments from bitcoin”. In Security and Privacy (SP), 2014 IEEE Symposium on, pp. 459–474.
Unicredit (2016). “Blockchain Technology and Applications from a Financial Perspective”. Technical Report.
Vasin, P. (2014). “BlackCoin’s Proof-of-Stake Protocol v2”. White Paper.
Zyskind, G., Nathan, O., Pentland, A. (2015). “Enigma: Decentralized computation platform with guaranteed privacy”. arXiv:1506.03471.
Francesco Corea 是一名英国伦敦的决策科学家和数据战略家。
原文链接:
https://www.kdnuggets.com/2018/01/convergence-ai-blockchain-deal.html