来源:中国信息通信研究院
“未来一段时期,我国数据库行业将围绕两个核心命题进行发展:一个是缩小“高要求的存量数据应用需求”与“仍处于发展初期阶段的供给能力”之间的差距;另一个是探索“创新型数据应用需求”与“数据库技术产品演进路线”的合理映射关系。”
日前,中国信息通信研究院正式发布了《数据库发展研究报告(2021年)》,本研究报告从技术、产业、应用三方面梳理了数据库发展情况,并展望了发展趋势。
据中国信通院测算,2020年全球数据库市场规模为671亿美元,其中中国数据库市场规模为35亿美元(约合240.9亿元人民币),占全球5.2%。预计到2025年,全球数据库市场规模将达到798亿美元,中国的IT总支出将占全球12.3%。中国信通院预计,中国数据库市场在全球的占比将在2025年接近中国IT总支出在全球的占比,中国数据库市场总规模将达到688亿元,市场年复合增长率(CAGR)为23.4%。
01、数据库技术发展历程
首款企业级数据库产品诞生于上世纪60年代,六十余年发展过程中,数据库共经历前关系型、关系型和后关系型三大阶段。
前关系型阶段(1960-1970):网状层次数据库初尝探索
前关系型阶段数据库的数据模型主要基于网状模型和层次模型,代表产品为IDS和IMS,该类产品在当时较好地解决了数据集中存储和共享的问题,但在数据抽象程度和独立性上存在明显不足。
关系型阶段(1970-2008):关系型数据库大规模应用
关系型阶段以IBM公司研究员E.F.Codd提出关系模型概念,论述范式理论作为开启标志,期间诞生了一批以DB2、Sybase、Oracle、SQLServer、MySQL、PostgreSQL等为代表的广泛应用的关系型数据库,该阶段技术脉络逐步清晰、市场格局趋于稳定。
后关系型阶段(2008-至今):模型拓展与架构解耦并存
谷歌的三篇论文开启后关系型数据库阶段,该阶段由于数据规模爆炸增长、数据类型不断丰富、数据应用不断深化,技术路线呈现多样化发展。随着各行业数字化转型不断深入,5G、云计算等新兴技术快速发展,传统数据库的应用系统纷纷优化升级。全球市场格局剧烈变革,我国数据库产业进入重大发展机遇期。
02、数据库技术发展趋势
大数据时代,数据量不断爆炸式增长,数据存储结构也越来越灵活多样,日益变革的新兴业务需求催生数据库及应用系统的存在形式愈发丰富,这些变化均对数据库的各类能力不断提出挑战,推动数据库技术的不断演进。
趋势一:多模数据库实现一库多用
多模数据库支持灵活的数据存储类型,将各种类型的数据进行集中存储、查询和处理,可以同时满足应用程序对于结构化、半结构化和非结构化数据的统一管理需求。未来在云化架构下,多类型数据管理是一种新趋势,也是简化运维、节省开发成本的一个新选择。
趋势二:统一框架支撑分析与事务混合处理
产业界当先正基于创新的计算存储框架研发HTAP数据库,其能够基于统一套引擎同时支撑业务系统运行和分析决策场景,避免在传统架构中,在线与离线数据库之间大量的数据交互。
趋势三:运用AI实现管理自治
目前有研究通过将传统数据库组件用机器学习算法替代,来实现更高的查询和存储效率,自动化处理各种任务。未来80%以上的日常运维工作有望借助AI完成。
趋势四:充分利用新兴硬件
随着新型硬件成本逐渐降低,充分利用新兴硬件资源提升数据库性能、降低成本,是未来数据库发展的重要方向之一。
趋势五:与云基础设施深度结合
Gartner预测,到2022年75%的数据库将托管在云端。云与数据库的融合,减少了数据库参数的重复配置,具有快速部署、高扩展性、高可用性、可迁移性、易运维性和资源隔离等特点。云原生数据库能够随时随地从多前端访问,提供云服务的计算节点,并且能够灵活及时调动资源进行扩缩容,助力企业降本增效。
趋势六:隐私计算技术助力安全能力提升
近年来以同态加密等密码学为代表的软件解决方案和以可信执行环境(TEE)为代表的硬件方案为数据库安全设计提供许多新思路。未来,此类数据库将围绕算法安全性和性能损耗等问题,逐步突破,进而提供覆盖数据全生命周期的安全保护机制。
趋势七:区块链数据库辅助数据存证溯源
区块链具有去中心化、信息不可篡改等特征,区块链数据库能够长期留存有效记录,数据库的所有历史操作均不可更改并能追溯,适用于金融机构、公安等行业的应用场景。未来,提升区块链数据库性能将成为学术界与工业界共同探索的命题。
03、数据库典型行业应用动态
金融、电信、政务、制造、互联网五个行业为数据库产品及服务采购份额前五的行业,采购总和占据全部市场份额的80%以上。
(一)金融行业&电信行业
据中国信通院统计分析,以业务系统数量为计数单位,我国金融行业各类数据库占比为Oracle 55%、DB2 19%、MySQL 13%、PostgreSQL 6%,其他 7%。
目前,金融和电信行业在数据库应用方面正在呈现三大趋势:一是大部分存量数据库将向分布式架构升级;二是应用大量非关系型数据库助力创新业务落地;三是产品选型逐渐倾向国产数据库供应商。
(二)政务行业
我国在提升社会治理的数字化治理水平过程中,主要呈现两大特点:一是个体、企业和社会等被治理对象数量庞大、日趋复杂,二是智能治理要求各层、各机构政府人员深度应用信息科技工具。当前政务行业在数据库应用方面正在呈现两大趋势:一是大范围应用空间型、关联型数据库等产品;二是利用各类工具组件,做到数据库应用“平民化”。
(三)制造业
当前物联网技术正逐步渗透工业领域,不断增长的传感器、飙升的数据量以及更高的大数据分析需求对原有的数据库系统提出了新的需求,包括增加扩展性、实现与大数据技术生态的友好对接、降低大规模应用价格、充分利用边缘计算设备能力。未来工业行业在数据库应用方面将呈现两大趋势:一是应用大量时序数据库;二是逐步向边缘计算发展。
(四)互联网
互联网行业为充分发挥新要素、新模式、新动能等方面的优势,对底层IT系统中的数据库提出了多项新要求,以性能好、造价低、迭代快为核心。未来互联网行业在数据库应用方面将呈现三大趋势:一是利用内存数据库加速业务效率;二是开源数据库应用更加广泛;三是初创公司利用云数据库促进其快速发展。
04、总结与展望
数据库作为提供数据存储与处理能力的软件产品,是各机构信息系统的关键部件,是助力数据价值释放的核心引擎。随着数据跃升为生产要素,数据重要性进一步提高,我国数据库产业也迎来新一轮变局。
从产业角度看,宏观政策利好推动了存量数据库市场上行,我国数据库产业进入蓬勃发展的初期,产品供应商、服务提供商、支撑产业从业者均积极行动,各自发挥技术、渠道、运营等优势,寻求对于自身最优的发展路径;另一方面云基础设施的发展成熟将接近一半的传统数据库市场转移到了线上,云计算企业利用既有基础设施优势,成为最大获益者。
从技术角度看,一方面数据应用的变化倒逼数据库具备更大数据存储容量、更多数据计算模型、更快数据业务响应能力,整体技术发展进入后关系型阶段,架构设计逐渐分布式化、模型构建逐渐场景化;另一方面,人工智能、新型硬件、区块链、密态计算等关联技术的创新正在催生新型数据库设计模式,传统数据库功能边界正被逐渐突破。在数据库产业和技术的变局过程中,供给侧、应用侧、生态侧均处于机遇与挑战并存的状态。