分布式基础，通俗易懂CAP？

会员服务 ·

分布式基础，通俗易懂CAP？

2018 年 10 月 30 日 架构师之路

分布式系统非常关注三个指标：

数据一致性
系统可用性
节点连通性与扩展性

关于一致性

数据“强一致性”，是希望系统只读到最新写入的数据，例如：通过单点串行化的方式，就能够达到这个效果。

关于session一致性，DB主从一致性，DB双主一致性，DB与Cache一致性，数据冗余一致性，消息时序一致性，分布式事务一致性，库存扣减一致性，详见文章《究竟啥才是互联网架构“一致性”》。

关于可用性

如果系统每运行100个时间单位，会有1个时间单位无法提供服务，则说系统的可用性是99%。

可用性和可靠性是比较容易搞混的两个指标，以一台取款机为例：

正确的输入，能够取到正确的钱，表示系统可靠
取款机7*24小时提供服务，表示系统可用

保证系统高可用的方法是：

冗余
故障自动转移

反向代理层，站点层，服务层，缓存层，数据库层各层保证系统高可用的方法，详见文章《究竟啥才是互联网架构“高可用”》。

关于连通性与扩展性

分布式系统，往往有多个节点，每个节点之间，都不是完全独立的，需要相互通信，当发生节点无法联通时，数据是否还能保持一致，系统要如何进行容错处理，是需要考虑的。

同时，连通性和扩展性紧密相关，想要加机器扩展性能，必须有良好的连通性。当一个节点脱离系统，系统就出现问题，往往意味着系统是无法扩展的。

反向代理层，站点层，服务层，缓存层，数据库层各层保证系统扩展性的方法，详见文章《究竟啥才是互联网架构“可扩展”》。

什么是CAP定理？

CAP定理，是对上述分布式系统的三个特性，进行了归纳：

一致性(Consistency)
可用性(Availability)
分区容忍性(Partition Tolerance)

并且，定理指出，在系统实现时，这三者最多兼顾两点。

一致性，可用性，多节点扩展性三者只能取其二，既然加锁已经加上，常见的最佳工程架构实践是什么呢？

互联网，最常见的实践是这样的：

节点连通性，多节点扩展性，连通性异常的处理必须保证，满足P
一致性C与可用性A一般二选一
选择一致性C，举例：传统单库水平切分，就是这类选型的典型
选择可用性A，举例：双主库同步高可用，就是这类选型的典型

强一致很难怎么办？

单点串行化，虽然能保证“强一致”，但对系统的并发性能，以及高可用有较大影响，互联网的玩法，更多的是“最终一致性”，短期内未必读到最新的数据，但在一个可接受的时间窗口之后，能够读到最新的数据。

例如：数据库主从同步，从库上的数据，就是一个最终的一致。

总结

CAP可以理解为一致性，可用性，联通与扩展性
CAP三者只能取其二
最常见的实践是AP+最终一致性

思路比结论重要。

架构师之路-分享可落地的技术文章

相关内容

CAP

关注 10

CAP原则又称CAP定理，指的是在一个分布式系统中，Consistency（一致性）、 Availability（可用性）、Partition tolerance（分区容错性），三者不可得兼。

【电子书】《计算机视觉中的多视图几何(第2版)》英文版，Multiple View Geometry in Computer Vision，附673页PDF

专知会员服务

132+阅读 · 2020年3月22日

【资源】100+本免费数据科学书

专知会员服务

108+阅读 · 2020年3月17日

【2020新书】Kafka实战：Kafka in Action，209页pdf

专知会员服务

69+阅读 · 2020年3月9日

【新书稿：《数学与计算：技术和科学的革命性理论》，340页pdf】《Mathematics and Computation - A Theory Revolutionizing Technology and Science》by Avi Wigderson (Princeton University Press 2019)

专知会员服务

41+阅读 · 2020年2月13日

【2020新书】JavaScript神经网络在TensorFlow.js中的深度学习，561页pdf

专知会员服务

104+阅读 · 2020年2月4日

【新书】Java企业微服务，Enterprise Java Microservices，272页pdf

专知会员服务

53+阅读 · 2020年1月30日

TensorFlow Lite指南实战《TensorFlow Lite A primer》，附48页PPT

专知会员服务

70+阅读 · 2020年1月17日

【干货】大数据入门指南：Hadoop、Hive、Spark、 Storm等

专知会员服务

98+阅读 · 2019年12月4日

【电子书】C++ Primer Plus 第6版，附PDF

专知会员服务

88+阅读 · 2019年11月25日

工行基于MySQL构建分布式架构的转型之路

炼数成金订阅号

15+阅读 · 2019年5月16日

分布式入门，怎样用PyTorch实现多GPU分布式训练

机器之心

7+阅读 · 2019年5月3日

亿级订单数据的访问与储存，怎么实现与优化

ImportNew

11+阅读 · 2019年4月22日

亿级订单数据的访问与存储，怎么实现与优化？

码农翻身

16+阅读 · 2019年4月17日

蚂蚁金服微服务实践（附演讲PPT）

开源中国

18+阅读 · 2018年12月21日

浅显易懂的分布式TensorFlow入门教程

专知

7+阅读 · 2018年6月22日

干货 | 受限玻尔兹曼机基础教程

机器学习算法与Python学习

7+阅读 · 2018年3月27日

送书 | 深入浅出，一起学习贝叶斯！

AI100

10+阅读 · 2018年2月2日

【区块链】区块链是什么？20问：读懂区块链

产业智能官

8+阅读 · 2018年1月10日

贝叶斯网络入门

论智

15+阅读 · 2017年11月19日

Unifying Graph Convolutional Neural Networks and Label Propagation

Arxiv

31+阅读 · 2020年2月17日

Invariance-Preserving Localized Activation Functions for Graph Neural Networks

Arxiv

4+阅读 · 2019年11月5日

Aspect-based Sentiment Classification with Aspect-specific Graph Convolutional Networks

Arxiv

11+阅读 · 2019年9月8日

NEAR: Neighborhood Edge AggregatoR for Graph Classification

Arxiv

5+阅读 · 2019年9月6日

Attributed Graph Clustering via Adaptive Graph Convolution

Arxiv

11+阅读 · 2019年6月4日

Temporal Deformable Convolutional Encoder-Decoder Networks for Video Captioning

Arxiv

6+阅读 · 2019年5月3日

GCN-LASE: Towards Adequately Incorporating Link Attributes in Graph Convolutional Networks

Arxiv

5+阅读 · 2019年2月26日

Red blood cell image generation for data augmentation using Conditional Generative Adversarial Networks

Arxiv

4+阅读 · 2019年1月18日

Optimal Algorithms for Non-Smooth Distributed Optimization in Networks

Arxiv

7+阅读 · 2018年6月1日

Adaptive Graph Convolutional Neural Networks

Arxiv

7+阅读 · 2018年1月10日

VIP会员