新一代开源分布式账本项目R3 Corda 技术揭秘:基于JVM开发

2018 年 3 月 15 日 高可用架构 魏佳

语言


Corda使用Kotlin作为开发语言,合约可以使用Java、Kotlin或者其他基于JVM的语言来编写。选择Kotlin的原因是:


  • 相比其他目前区块链流行的语言,比如C++或Golang,Java系有最强大的生态支持,和成熟的基础设施积累。

  • 因为是面向金融行业,应用技术栈也以Java为主(因为主导企业IBM、Oracle等为主),进而使得adoption cost尽可能小,开发更容易。

  • 对于金融行业这样有着厚重历史积累(技术包袱),以及各种异构系统,Java(JVM)平台有更成熟和强大的集成能力(比如数据仓库、离线计算等)。


除此之外,相比Java以及JVM平台的其他语言(Clojure、Scala、Ceylon等),Kotlin又平衡了语言灵活性和健壮性(相比Java提供了更多语言层面的改进,比Clojure、Scala又具备更平滑的学习曲线,同时IntelliJ官方对Kotlin的支持更强大)。

共识


  • 共识粒度小

  • 共识范围小


相比BTC或Ethereum这样的Permissionless网络,Corda提供一个更可信任的Permissioned P2P网络,所有transaction参与这都是authenticated和authorized。


所以Corda的共识机制舍弃了BTC或Ethereum这样的账本范围的全局共识,只要求transaction的所有参与者对于transaction达成共识。


因为舍弃了对账本的全网广播,舍弃了所有节点都需要验证所有的transaction,进而极大得提高了transaction的吞吐。


不像Ethereum的基于account的状态机模型,Corda采用了和BTC类似的基于transaction的UTXO模型,逻辑上完全对应金融系统的复式记账。


  • Notary


Corda中引入了Notary的概念,Notary负责确保UTXO模型中的“输入”的有效性,比如防止“double-spent”攻击。它是所有transaction验证和确认(verify和validate)的基础,本质上可以认为是Corda这个“半信任网络”中的“可信任中介”。逻辑上看是“中心化的角色”,但实际上Notary可以是一个网络,甚至可以是另一个基于某种共识的公链。


Command,合约和Flow


  • Command


因为面向金融行业,Corda最重要的设计目标是支撑现实世界的各种金融活动(交易行为),所以Corda从transaction的设计,到智能合约以及Flow的能力,都是为了描述自然世界的交易行为/动作,比如转账、存入/提现、开票/兑付等。

所以Corda在transaction中设计了command这个概念,command由transaction参与方来约定(含义),同时通过强制包含所有参与方的公钥来做验证(验证签名)。

为了映射自然世界中各种复杂的多方交易,Corda中引入了“复合公钥”(composite-keys)。其中的公钥以树结构组织:所有的叶子节点就是各个参与方的key,上层节点则约定阈值。


比如下面这个例子中,三人的公钥权重默认都是1,那么整个command有效的条件是:“alice和bob都要签名”或“只要charlie签名”。


  • 金融合约


Corda中另一核心特点就是它的合约系统,相比跑在EVM上的Ethereum的智能合约,Corda的合约本质上就是一个实现了Contract interface的Java class。这个接口只有一个用于验证transaction的方法verify和一个annotation。


@CordaSerializable
@LegalProseReference(uri: String)
interface Contract {

@Throws(IllegalArgumentException::class)
fun verify(tx: LedgerTransaction)
}


其中@LegalProseReference这个annotation是最有价值的特性,它关联了现实世界中真实的具有法律意义的合约!这样Contract接口的设计就满足了:


  1. 描述现实世界的合约。

  2. 对所有根据合约执行的transaction进行特定验证。




  • Flow


Flow是Corda中另一个重要的特性,本质上来说Flow就是一系列复杂的Command指令的编排,用来描述自然世界里涉及多方、多环节、有条件的复杂交易流程。因为Corda的共识是transaction级别参与方范围的,同时transaction的通信都是点对点的,所以flow的设计和实现非常直观和简单。

因为面向金融行业,Corda内置了大量开箱即用的Flow template(在net.corda.flows包),基本涵盖了金融领域主要交易流程。同时Flow支持组合和继承,方便自定义和编排。

Flow的底层实现是基于Quasar的,是JVM平台上实现了actor模型的纤程/轻线程库(Akka也是,但主要面向Scala)。通过Quasar的bytecode注入,可以实现flow的挂起、恢复等调度,这能进一步提高Corda系统的伸缩能力和并发能力。



数据存储


  • JPA

  • RDB


Corda的数据存储支持标准JPA规范,可以通过多种ORM库将数据持久化到关系型数据库。目前Corda实现里是内置了一个H2数据库。由于标准的JPA规范,这使得Corda节点可以非常容易得集成/复用金融行业使用广泛(几乎是唯一)的企业级RDB系统,比如DB2或OracleDB。

数据层面这种开放架构,使得企业客户完全能够将Corda的数据和自身业务数据无缝集成。比如通过SQL Join来统一查询,或输入到Hadoop进行离线计算等。


网络通信


  • AMQP over TLS


Corda借助ActiveMQ这个流行的消息中间件中的Artemis项目,以AMQP作为其网络通信协议,包括消息结构、序列化格式、加密方式等。

Artemis本身是个高性能、非阻塞的(基于Netty)支持多种协议的(AMQP、MQTT等)轻量级消息中间件。


  • NetworkMapCache

P2P网络部分,Corda通过NetworkMapCache使得每个节点都缓存一份网络拓扑,网络的变化会通知到所有节点。节点本身具备动态发现、注册和认证的能力。

目前的实现中,是简单得通过seed nodes的方式来初始化整个网络,代码注释里提到未来会集成Paxos或Raft来选举初始网络。


CorDapp


  • Plugin机制

  • REST

  • Fatjar


类似Hyperledger Fabric,Corda也采用了plugin机制来支持CorDapp。每个CorDapp需要扩展CordaPluginRegistry这个接口来注册自己,并通过REST API来向外提供服务。


CorDapp中的逻辑是通过声明或使用flow来实现的,客观上提高了安全性。CorDapp会打包成Fatjar的形式,上传并部署到Corda节点的JVM中。


系统集成及其他


利用Corda支持的JPA/JDBC,AMQP,REST等等这些数据层面、通信协议以及CorDapp接口,提供了非常开放易于集成的能力。


Corda节点内置一个web app,用来管理节点状态、网络状况和Dapp,比如交易记录等。



架构设计


下图是Corda的逻辑架构


2017年低,Corda和微软Azure达成合作,将Corda平台搬到Azure云上,推广更易使用的“分布式账本技术即服务”。



总结


本质上,Corda并不是去创建新的区块链(公链),而是致力于提供专门服务于泛金融行业“去中心化的ledger(数据库)”。相比其他区块链系统,由于针对金融行业的定位,做了一些方面的取舍和改进:


  • (在Permissioned网络环境下)降低了共识的范围和级别

  • 缩小了数据可见性

  • (所以间接)具备较高的吞吐

  • (强化了特定合约描述能力)提供了与自然世界法律/金融的映射


加上JVM强大生态、完善成熟的基础设施、大量开箱即用的工具,以及内置对金融行业领域的支持。


相关阅读:


只用200行Go代码写一个自己的区块链!

200行Go代码实现自己的区块链——区块生成与网络通信

200行Go代码实现区块链 —— 挖矿算法

区块链及比特币入门指南


特别推荐:


比特币、以太坊、ERC20、PoW、PoS、智能合约、闪电网络……

想深入了解及讨论这些话题?高可用架构在知识星球(小密圈)创建了区块链学习小组,共同学习区块链包括数字货币前沿技术,欢迎点击链接加入。


区块链学习小组


转载本文请注明出处,技术原创及架构实践文章,欢迎通过公众号菜单「联系我们」进行投稿。


高可用架构

改变互联网的构建方式

长按二维码 关注「高可用架构」公众号


登录查看更多
1

相关内容

Java 虚拟机(Java Virtual Machine)是一个虚构出来的计算机,通过在实际的计算机上仿真模拟各种计算机功能来实现的。
FPGA加速系统开发工具设计:综述与实践
专知会员服务
65+阅读 · 2020年6月24日
【北京大学】面向5G的命名数据网络物联网研究综述
专知会员服务
36+阅读 · 2020年4月26日
【新加坡国立大学】深度学习时代数据库:挑战与机会
专知会员服务
33+阅读 · 2020年3月6日
【新书】Java企业微服务,Enterprise Java Microservices,272页pdf
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
分布式入门,怎样用PyTorch实现多GPU分布式训练
机器之心
7+阅读 · 2019年5月3日
爱奇艺基于AI的移动端自动化测试框架的设计
前端之巅
18+阅读 · 2019年2月27日
去哪儿网开源DNS管理系统OpenDnsdb
运维帮
21+阅读 · 2019年1月22日
深度学习开发必备开源框架
九章算法
12+阅读 · 2018年5月30日
【区块链】区块链是什么?20问:读懂区块链
产业智能官
8+阅读 · 2018年1月10日
28 款 GitHub 最流行的开源机器学习项目(附地址)
七月在线实验室
4+阅读 · 2017年12月18日
【机器学习】推荐13个机器学习框架
产业智能官
8+阅读 · 2017年9月10日
开源巨献:阿里巴巴最热门29款开源项目
算法与数据结构
5+阅读 · 2017年7月14日
Arxiv
6+阅读 · 2020年4月14日
A Sketch-Based System for Semantic Parsing
Arxiv
4+阅读 · 2019年9月12日
Arxiv
9+阅读 · 2019年4月19日
Arxiv
18+阅读 · 2019年1月16日
VIP会员
相关资讯
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
分布式入门,怎样用PyTorch实现多GPU分布式训练
机器之心
7+阅读 · 2019年5月3日
爱奇艺基于AI的移动端自动化测试框架的设计
前端之巅
18+阅读 · 2019年2月27日
去哪儿网开源DNS管理系统OpenDnsdb
运维帮
21+阅读 · 2019年1月22日
深度学习开发必备开源框架
九章算法
12+阅读 · 2018年5月30日
【区块链】区块链是什么?20问:读懂区块链
产业智能官
8+阅读 · 2018年1月10日
28 款 GitHub 最流行的开源机器学习项目(附地址)
七月在线实验室
4+阅读 · 2017年12月18日
【机器学习】推荐13个机器学习框架
产业智能官
8+阅读 · 2017年9月10日
开源巨献:阿里巴巴最热门29款开源项目
算法与数据结构
5+阅读 · 2017年7月14日
Top
微信扫码咨询专知VIP会员