阿里、华为、浪潮等大厂争相布局,开源数据库真成 “香饽饽”了?
6月1日,蚂蚁科技集团自主研发的分布式OceanBase数据库宣布正式开源,并成立OceanBase开源社区。而就在两天前,阿里云刚刚宣布对外开放关系型数据库PolarDB数据库for PostgreSQL的源代码。日前,华为的openGause、浪潮的ZNBase等也先后宣布开源。大厂们不约而同的躬身入局似乎透露出一个重要信号:开源数据库正在以前所未有的强势之姿挺进国内、乃至全球数据库市场。
为什么是现在?
随着国内的开放原子开源基金会挂牌成立、工信部等部门联合 Gitee 建设中国独立的开源托管平台、TiDB 开发商 PingCAP 完成 D 轮 2.7 亿美元融资等一系列大事件的发生,行业对开源的热情高涨。而“十四五”规划首次将“开源”列入其中,并从底层基础设施方面进行了规划,明确指出应完善开源知识产权和法律体系,更是让业界对开源的信心大振。
DB-Engines 今年5月份数据库排名显示,传统数据库霸主Oracle依然居于榜首,但当月得分下降4.98。知名开源数据库MySQL较上月得分增长15.69,位列第二。再看国内市场,墨天轮5月国产数据库排行榜中,位列前三甲的TiDB、OceanBase、PolarDB皆为开源数据库。业内普遍观点认为,眼下数据库已经到了变革的重要关口,最直观的表现就是传统数据库持续衰落和云原生数据库、开源数据库等新一代数据库加速崛起。
对于厂商而言,抢占生态才是核心目的。神州数码数据战略咨询部总经理李盛在接受《中国电子报》记者采访时指出:“所有的应用、服务都‘生长’在数据库之上,所以它的‘绑定效应’非常强,迁移成本极高。大厂们真正在博弈的其实是生态,开源是为了吸引更多的用户来拓展自身生态。” Oracle曾在国内数据库市场一家独大,占有40%的份额。现在国产替代呼声渐起,这让国内厂商们看到了机会。
“拥抱开源将有助于合作伙伴和开发者了解和熟悉其数据库特性。应用厂商可以做到更好原生的适配。合作伙伴可以围绕其产品进行运维工具的开发。同时,开源社区将有助于经验分享,为实施和研发提供便利。” Forrester分析师卢冠男对《中国电子报》记者说道。开源不仅仅是一种选择,也代表了一种态度,代表了“多方协同、合作共赢、未来共享”的开放生态趋势。
在国内,数据库开源的道路并非一番风顺。“学术界、产业界、科研界,到领导层,对开源的态度其实经历了几个阶段的变化,从一开始觉得开源与否好像无关紧要,到现在认为开源可能会是国家在基础软件层面的必经之路。” 阿里云数据库负责人、达摩院数据库首席科学家李飞飞表示,“像PG、MySQL这种主流的开源数据库生态目前主要还是在海外,以美国为主导,我们希望能够一点一点的把社区的话语权和主导权转移到中国。”
开源时代,国内科技企业迎来了“弯道超车”的机会。如今数据成为数字化核心资产,拥抱开源有助于打破技术壁垒,摆脱对海外商业数据库公司的依赖,进一步提升国内企业在开源社区的影响力与话语权。
是“内卷”,还是共生?
OceanBase最大的亮点是100%全自研,承担蚂蚁金服核心链路支撑如“双十一”、支付宝等,并在中国工商银行、山东移动、福建移动、数字江西、中华保险、人保健康等上百家机构落地,经过了十余年不同场景的严苛打磨,强一致性,高吞吐量、高并发等优点毋庸置疑。
同为阿里系,阿里云推出的PolarDB主打“云原生“这张技术牌。云原生的好处是从一开始就能让用户充分享受到云计算可以灵活扩展的技术红利,支持更为海量数据,且灵活伸缩、性价比高。据介绍,此次开源的版本可以高度兼容现有的PG 和MySQL生态,适用于中大型企业核心业务场景。
有观点质疑,PolarDB和OceanBase同为阿里系的关系型数据库产品,现在又都开源了,会不会导致“内卷”消耗?业内资深人士评论称,相较之下,Oceanbase更为声势浩大,它有取代Oracle的野心,目前主要还是在金融电信行业更受欢迎;PolarBD则更偏技术流,行业属性没有那么明显。
此外,从开源平台来看,OceanBase相对保守,选择的木兰公共协议 MulanPubL-2.0 版属于传染型,对开源软件的分发条件有限制性要求,对云计算和SaaS等新兴技术的分发也有条件限制。而PolarDB则更大胆,选择了对开发者最友好的Apache Version 2.0协议,以全共享并尊重原作者著作权的模式开源,代码可以修改和再发布。
二者到底是什么关系?李飞飞曾在此前的采访中公开回应过:“PolarDB和OceanBase是良性的竞争关系。开源欢迎大家都来做,参与的人越多越好。只有竞争才能让系统和技术不断向前演进。”
这两款开源的数据库产品将进一步丰富阿里的软件生态,也会在良性竞争关系中加速创新突破,带动国产数据库的开放共赢。从这个角度来看,双方既是竞争者,也是友军。
据不完全统计,国内市场仅2020年新成立的数据库公司就有110家。主流玩家可被分为四大流派,分别是以南大通用、武汉达梦、人大金仓为代表的“学院派”,腾讯、阿里为代表的“互联网派”,TiDB、巨杉、万里开源、青云为代表的“创业派”和中兴、亚信为代表的“企业派”。参与开源的已不在少数。可以说,国产开源数据库赛道进入了百舸争流的局面。
开源之后,真正的挑战是运营
然而,开源只是第一步,OceanBase要做的还有很多。卢冠男谈到:“通过开源加速完善生态,蚂蚁会进一步提高市场覆盖度,让合作伙伴更专业,同时让自身更专注于产品研发,最终实现更广泛的满足客户需求并获取市场的目标。但需要注意的是,客户对数据库的需求很大一部分来自对原有数据库升级和替换,所以在规划、应用适配、部署和维护环节对专家服务团队的依赖度会很高,蚂蚁需要处理好数据库迁移的挑战,构建广泛的合作伙伴生态来做好服务环节。”
其实关于开源数据库的争议声一直都有。“虽然开源数据库没有高昂的商业授权许可费用,但也会带来不少问题。一些开源数据库易用性差、配套能力也较弱,需要不断地维护,而且一旦遇到数据丢失问题,很难快速恢复,造成的损失不可估量。”业内专家表示,“另外还得面临维护升级、人力运维等各类成本支出,即便上云也很难满足金融、政企等对数据安全、响应速度有严苛要求的大型企业。”
对此,李盛认为:“未来的生态一定是开源的,但国产数据库正在蓬勃发展中,产品、技术、服务水平都还在持续提升的过程中。”从商业模式上来看,基于开源版本衍生出的商用版本比纯商用版本更便宜、更灵活,同时还可以自己来进行二次开发,能够更好的满足业务需求。从安全性来看,数据库本身就会部署在相对安全的内网环境,开源的主要是技术而不是数据本身,即使数据应用、分析环节可能面临风险,但完全可以通过相关数据安全软件去进行自我保护。“至于核心业务系统的开源还需更多技术论证,不可操之过急。”
据了解,阿里云内部也曾展开过激烈的讨论,甚至“拍过桌子”,但最终还是决定开源。李飞飞表示:“开源是建立生态的一个关键抓手,它和商业化绝对不是天然矛盾的两面。一定要处理好二者之间的平衡,这就需要有非常强的定力和判断力。”他指出,开源并不是“灵丹妙药”,不是开源了就能解决所有问题,关键还是要看后续的社区运营。“是不是真的在用心做社区,能不能贡献出高质量的代码,让大家都能够从中获益,这才是开源之后要面对的真正挑战。”