专访王颖泽:国产数据库开源之路如何可控?

2018 年 5 月 7 日 数据库技术大会 赵钰莹
点击蓝色字关注"数据库技术大会" 一起玩耍哦~

中兴风波过后,大众对国产基础软件领域的关注倒是让不少厂商“受宠若惊”。“可控”成为公众对中国造的希望,开源面临的授权问题成为一颗悬在国产厂商头顶的达摩克利斯之剑。在数据库领域,不少国产厂商都有自己的想法和理解。其中,天曦科技很早之前就曾提出希望开创一条基于开源可控的国产数据库之路。在如今这个时代背景下,我们应该如何正确理解开源可控的含义?这条路应该如何走?终点又是什么呢?与国际一线大厂相比,国产数据库厂商的生存现状如何?面临的痛点有哪些呢?



借着第九届中国数据库技术大会(DTCC)的预热,笔者见到了本期采访嘉宾——王颖泽,天曦数据库技术总监。


对于开源可控之路,天曦科技如何解读?


随着开源社区的发展,开源技术在国内数据库领域的应用程度越来越高,天曦科技也不例外。根据王颖泽的介绍,天曦数据库在PostgreSQL基础上对Oracle兼容性进行了整体设计,主要包括三部分:第一,在数据库内核中,具备独立的Oracle的SQL语法解析器和PL/SQL语法解析器,这可使数据库仍完全兼容PG。在SQL层,实现Oracle数据类型、Merge Into、Connect By、表空间管理、DUAL、ROWNUM等;在PL/SQL层,将其作为PG的一种新PL语言;第二,在数据库接口中,依据内核支持Oracle兼容,对接口进行改造,目标是减少用户对应用代码的修改,甚至不需对应用代码修改;第三,在数据库工具中,除了提供管理工具,SQL编辑工具等常规工具外,还特别为Oracle迁移到TXDB制作了迁移工具,该工具还支持从Oracle到PG的迁移,且对性能进行了优化。


同样是开源技术,同样面临开源授权问题,天曦科技如何理解开源可控呢?王颖泽认为,PostgreSQL的License类似于BSD或MIT的License,是给予使用者很大自由的协议,既鼓励代码共享,又尊重代码作者的著作权。允许使用者修改和重新发布代码,也允许使用或在其代码上开发商业软件并进行发布和销售,这有利于商业集成。许多商业公司都在其上进行自己产品的二次开发,例如Pivotal的Greenplum,EnterpriseDB的PPAS等。


正如很多人所担心的,开源并不等于可控。天曦科技所倡导的开源是指基于开源版本的二次开发和修改。可控是指拥有从数据库内核到接口再到工具的全方位研发能力,能够针对自己的产品规划或者用户要求进行产品研发或产品定制,并能应对数据库上线后的各种问题,为客户提供全面的保障。这区别于只是在开源的基础上提供咨询、实施、调优和运维等服务。


至于为何偏偏在众多开源技术中选中了PostgreSQL,不仅仅是因为其相对自由的开源协议。王颖泽提及,PostgreSQL是业界公认较先进的开源数据库,其技术成熟、稳定可靠、功能强大,版本活跃。近几年,PostgreSQL版本更新迭代速度加快,越来越受到国内外技术人员的青睐。


其次,事在人为。天曦科技核心团队拥有多年PG研发经验,随着对其设计和了解的逐步深入,产品规划和设计也更加合理,在保障产品质量的前提下,研发速度可大大提高,这无疑增加了团队的信心与凝聚力。数据库这种基础软件的研发,需要长期的技术积累和大量研发投入。基于PG来进行自身产品研发,充分利用社区力量,无形中增加了技术实力。从长远来看,紧跟PG社区也能使自主研发的产品得以不断提升。


最后同样也是最关键的,天曦科技认为PG无论在功能、性能、稳定性,高可用及容灾方面都可满足市场上绝大多数使用Oracle数据库的应用场景。


国产数据库厂商或许不是做得不行,而是说得太少!


相较于起步早且发展成熟的Oracle,王颖泽认为Oracle无论从技术储备、研发投入、产品成熟度、品牌、上下游生态环境、客户规模/数量等都比国产数据库厂商有较大优势。国产数据库是本地化原厂服务,在服务上有很大优势。因为数据库产品的研发周期长,投入大,技术要求高,所以在产品不占优势的前提下,各个厂商都力争提供良好的服务来弥补产品上的不足。


但是,国产数据库厂商的实力绝不仅仅是我们可以看得到的服务上的这点优势。王颖泽表示,国产数据库或开源数据库在多数应用场景中是能够从功能、性能等多维度完全替换Oracle的。以天曦数据库为例,天曦数据库的核心竞争力主要体现在两方面,一是以开源PG为基础,站在巨人的肩膀上可借助社区力量不断提升产品,如在高可用和性能监控方面,天曦科技就借鉴了PG社区的相关方案和开源项目;二是在PG基础上实现Oracle兼容,不单是从语法、接口或内核上进行兼容,而是要考虑功能的一致和性能的接近,并兼顾用户使用习惯,尽量在不修改或少修改应用程序,不改变过往编程习惯、不重新学习的基础上完成对Oracle的替换。


此外,国产数据库厂商可以为用户的特殊应用场景提供定制化解决方案,可以针对用户要求对数据库进行定制开发。当然,国家政策层面对国产数据库还是有所倾斜的。


虽很少受到资本市场青睐,但近年来,国产数据库已经应用到政务、制造、保险、金融等各行各业,在实践中的变现也并不差。或许,我们应该给予国产数据库厂商更多的生存空间与发声机会。王颖泽在采访中表示,中兴事件为国产基础软硬件敲响了警钟,如果核心技术问题不能解决,中兴绝不会是最后一家被制裁的中国企业。但是,基础软硬件的发展需要技术积累,人才储备,周期长,进展慢。要想产品得到用户认可和接受,需要长期投入,短期内很难为企业带来巨大收益。未来,天曦科技会在安全和易用方面进一步提升,这也将成为天曦数据库新的核心竞争力。


前路漫漫,国产数据库厂商的成长面临哪些痛点?


前路漫漫,道阻且长。王颖泽在采访最后表示,天曦科技正处于起步阶段,对比国外几十年历史沉淀的大厂还有较大差距。王颖泽认为,国内的数据库厂商生存压力都很大,整个数据库市场的占有率相比国外厂商还只是很小的一部分,国产厂商只有把产品做出高品质,做出特色,才能最终赢得市场认可。近年来,数据库市场在逐年增长,国产厂商在市场份额上还有较大提升空间,天曦科技坚信好的产品必将受到市场认可,用心才能得心。


从技术方面来看,国产数据库要想发展,还需解决以下痛点:

1、数据库人才培养:数据库人才特别是从事内核研发和接口研发的人才在国内极度缺乏。国内高校对数据库技术深入研究力度不够,而致力于数据库产品研发的相关人才更少。

2、数据库技术积累:数据库的研发需要积累,需要承认与国外先进厂商的差距。技术积累也不是一朝一夕能够完成的,量变才能形成质变。盲目制定过高目标,不脚踏实地进行深入研究无法拿出高、大、上的产品。弯道超车要在技术创新的基础上才能实现,但是没有积累的创新就好比空中楼阁。

3、数据库研发管理体系:数据库产品研发区别于应用项目的研发,数据库在应用系统中所处的核心地位也导致其对质量的要求区别于应用产品。数据库研发管理将直接影响最终产品的质量和进度。试想对于成百上千万行代码,模块众多,相互之间关联复杂的研发项目而言,如何平衡质量和进度之间的关系,对较大功能如何拆分进而逐步完成等都与如何建立研发管理体系有关。

4、数据库生态建设:这也是国产数据库厂商目前非常薄弱的地方。这里的生态不光指数据库上下游厂商,比如芯片厂商,操作系统厂商,中间件厂商,备份系统厂商等,还包括使用数据库的用户和在其之上开发的应用厂商,进而包括整个培训、咨询、服务的生态体系。

上述问题涵盖了国产数据库研发的各个环节,王颖泽表示,这些问题不是一个数据库厂商就可解决的,甚至不是依靠众多数据库厂商就能够解决的。天曦科技能做的只是从自身出发,做好自己,让大家对国产数据库更有信心。

 

正如王颖泽所传达的,国产数据库确有差距,天曦科技愿意承认差距并努力追赶。国产数据库要走的路还很多,我们何不抱着一颗看好的心态期待未来呢?


数领先机 智赢未来

DTCC2018

中国数据库技术大会(简称 DTCC)是国内数据库及大数据领域规模最大、最受欢迎的技术交流盛会,每年一届。自 2010 年以来,迄今已成功举办了八届,累计参与人次达到 20000+。DTCC 每年都将邀请百余位行业专家,就热点技术话题进行分享,为数据库人群、大数据从业人员、广大互联网人士及行业相关人士提供最具价值的交流平台。


2018 年 5 月 10-12 日,第九届中国数据库技术大会(DTCC2018)将如约而至。本届大会以 “数领先机 • 智赢未来” 为主题,设定 2 大主会场及 20 个技术专场,邀请来自国内外互联网、金融、教育等行业百余位技术专家,共同探讨 Oracle、MySQL、NoSQL、大数据、机器学习、区块链、数据可视化等领域的前瞻性热点话题与技术。



点击左下阅读原文,立即购票

登录查看更多
0

相关内容

王颖,中国科学院前沿科学与教育局副局长,曾任中国科学院研究生院软件学院副院长、计算与通信工程学院执行院长、中国科学院大学副校长。她长期从事教育信息化、工程计算可视化和会计信息化的研究工作,先后主持863计划项目、国家科技支撑计划项目、国家自然基金项目、北京市自然基金项目以及技术开发项目10余项,在国内外核心期刊上发表论文70余篇,出版专著、译著和教材5部,培养硕士博士30余人。曾先后获得中科院教学成果二等奖、中国标准创新贡献一等奖、河南省教育厅科技成果一等奖、河南省科技成果二等奖等。担任中国会计信息化标准化委员会副主任,九三学社中央科技委委员,九三学社北京市教育委员会副主任。
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
125+阅读 · 2020年5月22日
【Manning新书】现代Java实战,592页pdf
专知会员服务
99+阅读 · 2020年5月22日
【实用书】Python技术手册,第三版767页pdf
专知会员服务
234+阅读 · 2020年5月21日
大数据安全技术研究进展
专知会员服务
92+阅读 · 2020年5月2日
【北京大学】面向5G的命名数据网络物联网研究综述
专知会员服务
36+阅读 · 2020年4月26日
【论文扩展】欧洲语言网格:概述
专知会员服务
6+阅读 · 2020年3月31日
【2020新书】如何认真写好的代码和软件,318页pdf
专知会员服务
63+阅读 · 2020年3月26日
专访阿里亚顿:Serverless与BFF与前端
前端之巅
45+阅读 · 2019年5月8日
VS Code Remote发布!真·远程开发
开源中国
6+阅读 · 2019年5月3日
大数据安全技术浅析
计算机与网络安全
14+阅读 · 2019年4月24日
数据库之架构:主备+分库?主从+读写分离?
架构文摘
8+阅读 · 2019年4月23日
云游戏行业发展趋势分析报告
行业研究报告
13+阅读 · 2019年3月24日
小米Note3 ‖ 国产首款支持人脸解锁手机
机械鸡
4+阅读 · 2017年9月12日
今日头条推荐系统架构演进之路
QCon
32+阅读 · 2017年6月21日
Deep Learning for Deepfakes Creation and Detection
Arxiv
6+阅读 · 2019年9月25日
Arxiv
3+阅读 · 2018年6月14日
Arxiv
4+阅读 · 2016年12月29日
VIP会员
相关VIP内容
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
125+阅读 · 2020年5月22日
【Manning新书】现代Java实战,592页pdf
专知会员服务
99+阅读 · 2020年5月22日
【实用书】Python技术手册,第三版767页pdf
专知会员服务
234+阅读 · 2020年5月21日
大数据安全技术研究进展
专知会员服务
92+阅读 · 2020年5月2日
【北京大学】面向5G的命名数据网络物联网研究综述
专知会员服务
36+阅读 · 2020年4月26日
【论文扩展】欧洲语言网格:概述
专知会员服务
6+阅读 · 2020年3月31日
【2020新书】如何认真写好的代码和软件,318页pdf
专知会员服务
63+阅读 · 2020年3月26日
相关资讯
专访阿里亚顿:Serverless与BFF与前端
前端之巅
45+阅读 · 2019年5月8日
VS Code Remote发布!真·远程开发
开源中国
6+阅读 · 2019年5月3日
大数据安全技术浅析
计算机与网络安全
14+阅读 · 2019年4月24日
数据库之架构:主备+分库?主从+读写分离?
架构文摘
8+阅读 · 2019年4月23日
云游戏行业发展趋势分析报告
行业研究报告
13+阅读 · 2019年3月24日
小米Note3 ‖ 国产首款支持人脸解锁手机
机械鸡
4+阅读 · 2017年9月12日
今日头条推荐系统架构演进之路
QCon
32+阅读 · 2017年6月21日
Top
微信扫码咨询专知VIP会员