金融级核心业务信任的 NewSQL 是怎么样的？答案都在这里

2018 年 5 月 18 日 CSDN

点击上方“CSDN”，选择“置顶公众号”

关键时刻，第一时间送达！

随着业务压力不断增大，分布式已经成为企业数据架构转型的确定方向。对于数据库，虽然分布式数据库已经出现多年，也在许多场景得到了广泛的应用。但是根据 Gartner 的数据库报告显示，未来，70% 以上的数据库需求仍然会集中在关系型数据模型上，其中最主要的应用就是核心在线交易系统。

此前，能够真正进入企业核心在线交易业务的分布式数据库屈指可数，特别是在银行这样严苛的核心交易系统，分布式架构改造一直十分谨慎。

针对这一需求，在数据库的演进上，此前的做法是从传统关系型数据库进行分布式改造，如 MySQL 的“分库分表”方案。但是实践证明这一路线仍不能很好满足需求。

如今，一种新的路线正逐渐占据主流，那就是在原生分布式数据库上，进行分布式 OLTP 功能的增强和 SQL 的强兼容，采用这一路线突破核心交易业务的代表之一，就是 SequoiaDB 巨杉数据库。

作为首批上榜 Gartner 数据库推荐报告的中国数据库产品，SequoiaDB 巨杉数据库 3.0，在产品 GA 发布后，经过近半年在金融级场景的测试、上线和稳定运行之后，于近期正式发布。

▌SequoiaDB 3.0 产品定位

SequoiaDB 巨杉数据库是一款金融级分布式数据库，包括了分布式 NewSQL、分布式文件系统与对象存储、与高性能 NoSQL 三种存储模式，分别对应分布式在线交易、非结构化数据和内容管理以及海量数据管理和高性能访问场景。

根据 Gartner 的数据库报告，Multi-model 多模是未来 10 年，下一代分布式数据库发展的最主要方向。从 1.0 的高性能分布式 NoSQL 数据库，到 2.0 加入的分布式对象存储，再到 3.0 完整协议级兼容 MySQL，SequoiaDB 经过 6 年的不断迭代创新，全面支持企业级结构化、半结构化以及非结构化数据存储。

SequoiaDB 3.0 产品维度

▌MySQL 完整协议级兼容

SequoiaDB 3.0 实现了 100% 的 MySQL 协议级兼容：

全面兼容：全面支持 MySQL 协议与语法，用户可以直接使用 MySQL 客户端或任何管理、开发与监控工具对数据库进行操作；
MySQL 语法：由于使用了 MySQL 原生的解析器，SequoiaDB 3.0 能够实现 100% 的 MySQL 语法兼容，支持语法包括基础 CRUD 操作、多表关联、跨节点事务操作、创建视图、存储过程、索引和访问计划等。
无缝切换：对于任何已有应用程序，SequoiaDB 3.0 提供全面的 MySQL 兼容，几乎无需应用程序代码调整，即可无缝切换；
分布式弹性扩展：通过 SequoiaDB 存储引擎原生分布式架构，数据库在兼容 MySQL 同时，无需“分库分表”，分布式存储引擎直接提供弹性容量扩展能力，可以上百倍提升应用程序的存储空间与访问性能；
表多维分区：通过存储-SQL 分离架构，用户访问 MySQL 也可以实现表的多维分区，提升应用的灵活性。

SequoiaDB 3.0 MySQL 兼容架构

SequoiaDB 3.0 采用了“存储-SQL 分离”的架构，类似架构也出现在 AWS 的 Aurora 数据库等众多新一代分布式数据库上。

SequoiaDB 3.0 使用了 MySQL 数据库原生的 SQL 解析器，天然支持 MySQL 协议并可以做到 100% 语法兼容。在该架构中，MySQL 协议解析层作为 SQL 解析和分发的角色，直接面对应用程序，每一个 MySQL 服务的接入节点都是一个独立支持读写操作的 MySQL 进程。而数据存储和管理层，则完全由巨杉数据库的分布式数据库引擎实现。简单来说，SequoiaDB 3.0 作为 MySQL 的 InnoDB 替换引擎，在天然支持 MySQL 的全部语法和功能的同时，提供了数据库存储层弹性扩张的能力。

▌金融级分布式 OLTP

SequoiaDB 3.0 的 MySQL 兼容主要体现在 SQL 语法层面，而针对分布式 OLTP 业务的其他众多数据管理机制，均在 SequoiaDB 的分布式数据库引擎实现。

SequoiaDB 3.0 针对分布式 OLTP 业务，在分布式存储引擎方面带来了一些重要的提升：

ACID：

ACID 是交易型数据库的基础，SequoiaDB 3.0 已经全面支持 ACID，100%支持原子性、一致性、隔离性与持久性；

跨表跨节点事务：

在分布式数据库中，多节点间的原子性操作需要特殊的方式实现，SequoiaDB 3.0 使用二段提交的方式支持跨表跨节点事务能力；

隔离性：

支持 read-committed 隔离级别；

锁机制：

SequoiaDB 内核对记录锁的管理进行了优化，完全避免了在大量并发交易时的锁拥堵问题；

CBO（Cost-Based Optimization）基于开销的优化：

实现对集合内的数据以及索引进行统计抽样，建立多维度、多层级的数据模型；并对外部查询语句进行“重写”、“规则优化”、“参数化”以及“谓词降解”优化，提升访问性能，这也是目前企业级数据库主流的优化器优化方式；

表压缩：

针对表级别的数据压缩，提供两种压缩方式，压缩比例最高超过 60%，极大提升性能和吞吐量；

安全性：

分布式架构支持高可用与异地灾备机制，在提供一主多备存放的同时还支持读写分离模式。SequoiaDB 3.0 原生支持两地三中心等异地容灾策略，保证交易数据安全可靠。

▌对象存储与文件系统

SequoiaDB 3.0 在对象存储 API 的基础之上提供了标准 Posix 文件系统接口，能够原生接入任何支持 Posix 协议标准的操作系统，用户对应用程序无需任何改造即可从 NAS 迁移至 SequoiaDB。

在使用 Posix 文件系统的基础上，SequoiaDB 3.0 完全避免了传统文件系统在存储大量文件时所产生的性能瓶颈。同时，得益于 SequoiaDB 的分布式架构，其对象存储与文件系统特性在对应用程序零改造的前提下，成百上千倍地提供了存储的扩展性以及并发吞吐能力。

在该版本中，还引入了“偏移锁”机制，当并发操作同一个文件时，每一个并发只锁定其偏移内的内容，这样即可以保证并发情况下文件内容的正确性，极大地提升了外部访问的并发度。

▌全文检索

SequoiaDB 3.0 支持全文检索能力。用户可以通过创建针对指定字段的全文检索索引，对字符串中的内容进行实时模糊匹配，达到像使用普通查询一样方面地使用全文检索功能。

在索引类型中，增加了新的“全文索引”类型，用户只需要在对集合创建索引时指定为“全文索引”类型即可以轻松地创建。在全文索引创建后，索引定义的内容会自动同步至全文索引引擎，之后新的数据变化也会快速同步至全文索引引擎中。

SequoiaDB 3.0 支持异步全文索引，在高吞吐量的数据导入时不会对导入性能造成任何影响。

▌容灾与安全

SequoiaDB 原生支持数据库内核级别的高可用以及跨数据中心灾备能力，不需要使用第三方工具即可使用多副本对数据进行保护，完全满足金融级要求：

数据中心内高可用安全：RPO、RTO 为 0，迅速响应无缝切换；
异地容灾：异地容灾和备份，保证数据安全，中心间距离超过 1000km 以上。满足“两地三中心”的监管需求；
同城双活：同城双中心的数据实时同步，保证数据一致；双中心数据可以实现同时读写，大大提升读写效率；中心切换 RPO 为 0 ，RTO 小于 1 分钟；
更便捷的灾备管理：系统集群中统一管理灾备中心，简化了维护成本，也帮助使用者更快上手。

▌性能

SequoiaDB 3.0 在性能方面也有持续提升。通过 Sysbench 标准测试，SequoiaDB 3.0 性能表现优秀。测试主要考察三种场景，插入、查询以及交易事务几项基础数据库操作指标，以下为相关的测试方法以及结果：

Insert：单条数据插入

启动 3 个 96 并发运行 Insert 的 Sysbench 进程 30 分钟，SequoiaDB 测试结果：平均响应时间为 5.28ms, TPS 为 54,513.58 笔/s，成功率为 100%。

Select：索引查询，精确匹配中一条记录

启动 3 个 96 并发运行 Select 的 Sysbench 进程 30 分钟，SequoiaDB 测试结果：平均响应时间为 1.42ms, TPS 为 202,886 笔/s，成功率为 100%。

OLTP 事务操作：

一个 OLTP 事务包括 10 个精确索引匹配查询，1 个索引范围查询，1 个索引范围查询汇总，一个索引范围查询排序，一个索引范围查询去重，一个精确匹配更新索引字段，一个精确匹配更新非索引字段，一个精确匹配删除，一个单条记录插入（主键为删除记录字段的值）。

启动 3 个 96 并发运行 OLTP 的 Sysbench 进程 30 分钟。

SequoiaDB 测试结果：平均响应时间为 68.74ms，TPS 为 4,198.29 笔/s，成功率为 100%。

▌小结

SequoiaDB 3.0 目前已经在金融行业的企业用户准核心业务和众多的实时在线交易场景投入使用。经过金融级核心业务的考验，SequoiaDB 3.0 将会在未来拓展至更多行业应用场景，成为比肩国际巨头的中国分布式数据库产品。

引导分享与赞

登录查看更多

相关内容

Mysql

关注 397

一个开源的关系型数据库，开发者为瑞典 MySQL AB 公司。在2008年1月16号被 Sun 公司收购。而2009年，SUN 又被 Oracle 收购.目前 MySQL 被很多互联网企业所使用。有体积小、速度快、总体拥有成本低，开放源码等优点

商业数据分析，39页ppt

专知会员服务

165+阅读 · 2020年6月2日

【实用书】Python技术手册，第三版767页pdf

专知会员服务

240+阅读 · 2020年5月21日

2020年中国《知识图谱》行业研究报告，45页ppt

专知会员服务

240+阅读 · 2020年4月18日

工程领域大数据和人工智能原则

专知会员服务

126+阅读 · 2020年3月26日

规则就够用？还是必须上机器学习？这46页ppt教你如何把规则引擎和机器学习融会贯通

专知会员服务

57+阅读 · 2020年3月22日

近期必读的12篇KDD 2019【图神经网络（GNN）】相关论文

专知会员服务

63+阅读 · 2020年1月10日

【阿里技术论文】AliMe KBQA:阿里小蜜中的结构化知识问答

专知会员服务

83+阅读 · 2019年12月14日

智能客服在腾讯游戏的实践，腾讯AI平台部智能客服方向技术负责人唐国华，第八届全国社会媒体处理大会SMP2019

专知会员服务

38+阅读 · 2019年10月24日

金融大数据平台建设实践，深圳证券信息有限公司数据中心张俊总监，第八届全国社会媒体处理大会SMP2019

专知会员服务

38+阅读 · 2019年10月24日

医疗知识图谱构建与应用

专知会员服务

390+阅读 · 2019年9月25日

工行基于MySQL构建分布式架构的转型之路

炼数成金订阅号

15+阅读 · 2019年5月16日

阿里 P7 前端高级工程师，都需要掌握哪些技术栈？

前端大全

14+阅读 · 2019年5月13日

阿里 P8 Java高级工程师，都需要掌握哪些技术栈？

ImportNew

16+阅读 · 2019年5月9日

【数字孪生】数字孪生是工业互联网关键技术和重要场景

产业智能官

39+阅读 · 2019年4月9日

蚂蚁金服微服务实践（附演讲PPT）

开源中国

18+阅读 · 2018年12月21日

直到被解雇的那一天，我才知道，这些能力有多重要

InfoQ

8+阅读 · 2018年10月29日

Python 杠上 Java、C/C++，赢面有几成？

CSDN

6+阅读 · 2018年4月12日

智能时代如何构建金融反欺诈体系？

数据猿

12+阅读 · 2018年3月26日

精准营销，如何构建一套完善的用户画像体系？

数据猿

16+阅读 · 2018年3月20日

【区块链】区块链是什么？20问：读懂区块链

产业智能官

8+阅读 · 2018年1月10日

Knowledge Graphs

Arxiv

102+阅读 · 2020年3月4日

Compact Trilinear Interaction for Visual Question Answering

Arxiv

6+阅读 · 2019年9月26日

Read + Verify: Machine Reading Comprehension with Unanswerable Questions

Arxiv

3+阅读 · 2018年11月15日

Fire SSD: Wide Fire Modules based Single Shot Detector on Edge Device

Arxiv

3+阅读 · 2018年10月16日

Rapid Customization for Event Extraction

Arxiv

7+阅读 · 2018年9月20日

Convolutional 2D Knowledge Graph Embeddings

Arxiv

4+阅读 · 2018年7月4日

Improv Chat: Second Response Generation for Chatbot

Arxiv

4+阅读 · 2018年5月10日

Unsupervised Neural Machine Translation

Arxiv

6+阅读 · 2018年2月26日

PEYMA: A Tagged Corpus for Persian Named Entities

Arxiv

5+阅读 · 2018年1月30日

SSD: Single Shot MultiBox Detector

Arxiv

5+阅读 · 2016年12月29日

VIP会员