我很多时候都是在思考一个数据库国产化替代的建设方案,阅览了很多的材料。今年刚好是我参加工作后的第31个年头,工作的最初十年,我写了十年代码,从汇编、COBOL到C语言,写了几十万行代码;随后的十几年,我一直在帮助大家用好数据库,也在帮助Oracle推广RAC技术;2015年开始,我一边继续从业数据库优化的工作,一边在帮助客户怎样从Oracle迁移到成本更低的数据库系统上。

因此对国产数据库我一直有一种十分独特的情感,这是一种爱恨交织的情感。所以今天用“乱象”这个题目的时候,还是有些犹豫的,在国产数据库发展如火如荼的时候,泼这盆凉水合适不合适。国产数据库行业乱象总结。

依据工信部数据库发展白皮书2021的描写,截至2021年6月底,仅是国内关系型数据库厂商就已达到81家,估计马上要公布的2022版里突破100家甚至150家都是很有可能的。相较于十多年前的寥寥数家,这些年国产数据库产业发展确实是十分迅速,用逆势而上来描述也不为过。这些新型的国产数据库厂商里,也不乏具备非常强劲基因,投资极大,真正用心在做数据库产业的企业,不过,原本就起步较晚,人才资源、资金投入都不太充足的国产数据库产业,再被隔断为那么多的细微企业,每个独立个体的真实能力就值得怀疑了。不论是CPU,服务器,操作系统,中间件这些IT基础设施,投身于里面的企业想不到有这么多,这不知道是中国数据库之幸还是灾祸。

从成立年限来看,我们的国产数据库企业还很年轻,不过创立20年以上的企业还是有十四家,只不过这些企业的这20年并不好过,以数据库商品销售为主业压根存活不下去。因此虽然有20年的历史,事实上真正的历史也许要打些折扣的。

国产数据库
国产数据库

只看历史可能还无法直接体会到差别,但从从业人数来看,就能看到国产数据库产业碎片化的苦果了。超出60%的数据库厂商不足100人,而超出500人企业不足10%。最大的企业的规模可能不如某个就算二三流的海外数据库厂商的一个小研发部的规模。如果将人员再优化为管理、研发、商品、市场、销售、后勤等部门,也许研发人员就更是少的可怜了。听说目前我国最大的数据库厂商的开发人手不足500人,这便是中国数据库企业的现况。

假如我们再来看看技术层面的东西,从专利数量来看,90%的数据库企业的数据库领域的专利数低于100件,所有的关系型数据库厂商的专利数加在一起不足4000件,而截至2020年,Oracle公司一家企业的专利数就超过1万4千件。在技术基础薄弱,人才匮乏的情形下,为何一下子能涌现出如此多的数据库企业和产品呢?从国产数据库的技术来源分析上我们就可以看出一些端倪了。

上边这一图表是我们依据收集到的材料自己做的,不一定十分精确,但是能够大致反应出国产数据库的技术来源。大部分是来自于开源项目。因此才会发生大量规模较小的数据库公司。应用开源技术来发展自已的数据库产业并不是一件错事,事实上我还是比较赞同的。灵活运用开源技术可以加快国产数据库产业发展,减少与国外头部企业的差距。但是运用开源技术不等于彻底借助开源技术,而是应该在开源技术前提下开展大量科技创新,添加自已的技术。

数据库的编码自主化率一直是个迷,如果看工信部的编码自主化检测报告,那样绝大部分称为国内自研的数据库产品都可以取出很高自主化率的汇报来,并且动不动全是95%以上。我曾经检测过一个称为编码自主化率超过95%的数据库商品,其SQL模块是绝对“适配”MYSQL的,存储引擎用的不是INNODB。有一次一不小心我将一个不太常见的MYSQL原生态的参数调整了一下,想不到,SQL模块的工作模式竟然依照参数的规定调整了。

如果仅仅为保持MYSQL词法的兼容性的自主化编码,连这类细微之处都模仿的这般极致,那也太牛了吧。尽管国产数据库的专利很少,不过这不影响国产数据库弯道超越,若不能把Oracle拉出来完爆一番都不好意思说自己是国产数据库。而真实应用领域下却反映出来我们的国产数据库在CBO和SQL模块层面与Oracle差别甚大。我也曾经和一些数据库研发人员做了深度交流,他们也承认,在数据库上减少与Oracle的差别是十分困难的。不论在人才积淀、资金分配与实际应用案例的反馈等方面都存在巨大的差距。

最后一个乱像是评价体系的乱象,每年都要颁布各种所谓国产数据库排名榜,当然这种排名榜似乎有点排排坐吃饭的感觉,第一名和第二十名的评分不超过5分,前几天我看见一个榜单,第一名和第十名的分数仅有1分多。如果我是一个企业的IT主管,会有一个错觉,这一榜单上的产品,随便选也不会有多大的区别吧。墨天轮有个国产数据库时兴度排行,是效仿DBENGINE的,算是目前较为全的常态榜单了。但是墨天轮里的有关数据库的讲解材料也就是每个数据库厂商提供的宣传资料,并无相对客观的第三方评价。每一个评价体系和排名榜全是当好好先生,这很不利于国产数据库的发展。

国产数据库行业乱象总结。

国产数据库如今迎来最好的发展机遇,己经看见了芯片,服务器、安全等行业都在这一机会到来时显出了蓬勃生机。但在我相对熟悉的数据库行业,我看到的只是一种表层的兴盛,并没有看见一种良好的发展方向,期待这种局面很快会有所改观,期待国产数据库产业可以迅猛发展。

更多文章,请持续关注《MySql教程网》https://mysql360.com