重磅!信通院开源国内首款金融数据库性能测试工具,力争成为中国的 TPC

2022 年 2 月 18 日 AI前线
作者 | 冬梅
采访嘉宾 | 中国信通院云计算与大数据研究所 高级业务主管 马鹏玮

2 月 17 日,由信通院主办的国内首款金融数据库性能测试工具开源发布会在线上召开。会上,定位于国家高端专业智库、产业创新发展平台的信通院宣布开源了该测试工具,并详细阐述了开源此工具的背景、初心、历程以及愿景。信通院云大所副所长魏凯表示,将该款测试工具开源出来,也是希望借助平台的力量推动我国数据库产业健康、可持续地发展。

国产数据库百花齐放,选型和测评成为困扰

2022 年 1 月 17 日,据国际数据公司(IDC)发布的《2021 年上半年中国关系型数据库软件市场跟踪报告》显示,2021 上半年中国关系型数据库软件市场规模为 11.9 亿美元,整体市场同比增长 37.2%,IDC 预测,2021 全年中国关系型数据库软件市场规模为 27.5 亿美元, 到 2025 年将达到 76.7 亿美元,未来 5 年市场年复合增长率(CAGR)为 30.4%。

毫无疑问,资本的目光紧盯上了数据库这块大蛋糕。据相关数据显示,仅在 2021 第四季度,全球数据库初创企业就募集了超过 22 亿美元的资金,国内的数据库产品更是可谓百花齐放。在全面数字化转型的过程中,数据库也迎来了换道转型的关键时期,其中最明显的变化就是云原生和分布式数据库时代真正来临了。

一方面数据库产品多点开花昭示着这个行业是欣欣向荣的,这对行业来说是个利好,但另一方面,对于企业而言,要在纷繁复杂的数据库产品中选出适合自己企业的产品也愈发困难。在看到了这种现象出现后,作为信息社会创新发展的思想库和使能者,信通院也在关注数据库的 Benchmark 的实践应用及演变。技术在变、应用场景在变、产业的主体也在变,所以这也给信通院提供了一个契机和窗口,为数据库产业提出具有时代特色的 Benchmark 软件工具。

在所有应用场景中,最典型的场景是金融行业,它对数据库的可拓展性、安全性、兼容性等要求是极为苛刻的。那么,应该怎样测评一款数据库是否符合当前的应用场景?

此前,数据库性能测试长期依托 TPC( Transaction Processing Performance Council,事务处理性能委员会)推出的 TPC-C 评测标准。但由于其存在工具不统一、场景不对口等问题,难以满足当前我国数据库产业新发展阶段需求。此外,TPC-C 的商品批发销售模型不能完全模拟金融机构实际业务中的事务,TPC 也不提供官方测试工具,第三方工具五花八门,测试结果难以横向比较。

基于以上种种,2018 年,中国信通院联合北京银行、建设银行以及多个领域头部企业,共同设计研发了金融数据库性能测试工具(Databench-T),并依托工具开展了统一标准测试,有效指导了金融行业数据库选型工作。2022 年开年之际,为使工具更快、更好地为相关方服务,信通院特将 Detabench-T 进行开源。

项目开源地址:https://gitee.com/caict-bigdata/databench-t

四年磨一剑,力求打造中国 TPC

自 2018 年至今,信通院联合各大银行及多个领域头部企业深耕打磨的 Detabench-T,为什么选择金融行业来首次试水?据中国信通院云计算与大数据研究所业务主管刘思源介绍,2020 年,信通院从公开的数据中统计到金融业占全国的 GDP 是 8.2%,是除了制造业之外最大的一个行业。

除此之外还有一个重要的原因就是金融、监管机构从 2017 年开始规划了很多政策文件,这些文件为金融信息系统向分布式架构转型的方向提出了很多的高层次指导意见。

于是,从 2018 年年底开始,信通院联合了北京银行、建设银行一起来开发,并邀请了来自腾讯、华为、中兴等企业的多位专家来共同参与该款工具的总体设计和实现。

DetaBench-T 工具总体架构分为三大模块,工具的总体架构图如下:

刘思源表示,在我国数字化转型大背景下,很多行业都处于蓬勃发展的阶段,对于数据库这类基础软件有着极端的要求。数据库应用侧不断涌现的一些需求也在快速变化,存量市场需要替换,增量市场也要创新。但目前来说,存量市场和增量市场有两大矛盾:

首先,就存量市场而言,据 2021 年信通院统计数据显示,国内已经有 80 多家数据库企业,一百多款数据库产品,今年的数据将会更多,产品的同质化竞争较为严重。但供给侧的发展相对来说并不是特别清晰,应用侧也很难在众多数据库产品中做出选择。

其次,就增量市场而言,随着数字化转型的不断推进,数据和数据业务上云已经成为一种主流趋势。目前来讲,未来数据库的一些创新方向和实现路径以及应用模式还缺乏成熟的、可借鉴的经验。

在这两大矛盾作用下,信通院在数据库领域的定位就很明确了,一是优化存量市场的竞争环境,对于存量市场中一些相对来说不那么适应新需求的数据库进行平稳的替代;二是找到新的数据库的发展方向,引领整个产业标准化达成共识。

此次发布的 Detabench-T 工具,也是希望能从根本上推动我国 ICT 领域健康、快速发展,使工具能更快、更好地为相关方服务。

项目开源地址:https://gitee.com/caict-bigdata/databench-t



你也「在看」吗?👇

登录查看更多
0

相关内容

性能是数据库应用的永恒话题,也是衡量一个项目成功与否的重要指标。
阿里云发布《中国云原生数据湖应用洞察白皮书》
专知会员服务
40+阅读 · 2022年4月15日
《数据中台交付标准化》白皮书
专知会员服务
117+阅读 · 2022年3月21日
中国“5G+工业互联网”发展报告(附下载),49页pdf
专知会员服务
73+阅读 · 2022年1月21日
专知会员服务
43+阅读 · 2021年10月6日
专知会员服务
72+阅读 · 2021年8月3日
专知会员服务
79+阅读 · 2021年7月28日
数据库发展研究报告(2021年)
专知会员服务
46+阅读 · 2021年6月29日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
133+阅读 · 2019年12月12日
中国自主的数据库评测,是如何开展的?
中国开源贡献已达世界前二!
CSDN
0+阅读 · 2022年2月11日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Accurate ADMET Prediction with XGBoost
Arxiv
0+阅读 · 2022年4月15日
Arxiv
57+阅读 · 2022年1月5日
Arxiv
15+阅读 · 2021年2月19日
VIP会员
相关VIP内容
阿里云发布《中国云原生数据湖应用洞察白皮书》
专知会员服务
40+阅读 · 2022年4月15日
《数据中台交付标准化》白皮书
专知会员服务
117+阅读 · 2022年3月21日
中国“5G+工业互联网”发展报告(附下载),49页pdf
专知会员服务
73+阅读 · 2022年1月21日
专知会员服务
43+阅读 · 2021年10月6日
专知会员服务
72+阅读 · 2021年8月3日
专知会员服务
79+阅读 · 2021年7月28日
数据库发展研究报告(2021年)
专知会员服务
46+阅读 · 2021年6月29日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
133+阅读 · 2019年12月12日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员