大变局:国产数据库的机遇与挑战|深度研报

光锥智能
关注

5. 市场规模及增速

(1)全球市场规模及增速

Gartner报告显示,2020年全球数据库市场规模为648亿美元,占基础软件支出最大构成。未来,数据库市场的规模还将继续增长,预计到2024年,全球数据库市场规模将达到1000亿美元。

云数据库是未来趋势:云原生数据库正在成为一种重要的数据库新形态,根据Gartner数据,2020年云数据库已占据整体数据库市场份额的40%,且贡献了增长市场的9成以上份额,据Gartner预测,到2023年75%的数据库会被直接部署或者向云上迁移,营收数据将占据数据库整体市场的半数以上。

Gartner对数据库细分市场的规模统计,2020年关系型数据库全球市场规模为531亿美元,占比83.3%。

根据Gartner,2020年非关系型数据库市场增速34.5%,关系型数据库市场增速15.2%。全球非关系型数据库(NoSQL)在 2020~2022年市场增速30%左右,远高于数据库市场整体增速。

(2)中国市场规模及增速

数据规模爆炸性增长,数据应用快速深化,叠加网信产业的快速发展和新基建的深度布局,我国数据库产业进入重大发展机遇期。据中国信通院测算,2020年中国数据库市场规模约241亿元。预计到2025年,中国数据库市场规模将达688亿元,年复合增长率为23.4%。

我国数据库市场规模在全球占比约5.2%,而同期我国IT支出在全球占比约12%。

2020年我国数据库市场规模在国内IT支出占比约0.9%,而全球这一比例则达1.9%。两组数据都表明,我国数据库市场增长潜力巨大。

伴随云计算底层设施成熟,云端数据库市场份额迅速扩大。中国信通院报告显示,2020年我国公有云数据库市场规模为107.68亿元,占我国数据库规模45%,未来5年复合增长率36.1%,预计到2025年公有云数据库市场规模将超过500亿元。

中国关系型数据库规模为31亿美元,占比76%。由此可见,关系型数据库在国内外无疑都是数据库中的绝对主流。

6. 市场增长的驱动因素

互联网大规模商用,加速数据的产生、流通和融合,海量数据规模和复杂数据结构驱动数据库市场稳定增长。IDC和Ovum 预计2024 年全球数据总量和流量将分别保持4 年CAGR 28.1%和27.6%的强劲速度,更大的数据量级对数据库的扩容、性能、功能提出了新的需求。

此外,人工智能、机器学习、语义分析、图像识别等技术则需要大量的非结构化数据来开展工作,NoSql存在发展机遇。根据IDC 数据,非结构化数据占整体数据量比重高达80%以上,这意味着绝大部分非结构化数据的价值还未被充分发掘。

企业上云趋势明显,数据库成为连接IaaS到应用的关键环节。数据显示,在过去十年,企业上云的意愿从3%上升到了84%;2020年我国已经应用云计算的企业占比达到72.1%,较2019年上升了6%。伴随着企业上云进程的不断深入,企业上云从资源上云逐步进入到应用上云,数据库作为PaaS层产品,成为关键环节。

政策利好本土厂商,「信创」风口,国产数据库的新机遇。2020-2022 三年时间,信创产业进入好用阶段,将在党政军和八大核心行业(金融、电信、能源、电力、医疗、教育、交通、公共事业)铺开。云数据库厂商、本土数据库厂商份额持续增长,国际数据库品牌份额下降。

信创指硬件和软件的一系列信息化创新技术,可理解为数字基建,是新基建最底层的一环,主要包括核心芯片、基础硬件、操作系统、中间件和数据服务器等领域。信创产业是数据安全、网络安全的基础,也是「新基建」的重要内容,将成为拉动经济发展的重要抓手之一。

从信息基础设施国产化程度来看,目前国内重要信息系统、关键基础设施中使用的核心信息技术产品和关键服务大多依赖国外。例如中美贸易战,Oracle停止美国敌对国家的数据库服务后,导致数据库功能缺失,促使数据库加快国产替代。

产业链与行业格局

1. 产业链及行业图谱

数据库与芯片、操作系统并列为全球技术三大件,也是企业IT系统必不可少的核心技术。在数据库软件产业链中,上游多是以服务器厂商、芯片厂商组成的网络和硬件厂商;中游由数据库、操作系统和中间件等基础软件厂商组成;下游主要是各行业的应用开发商。

数据库管理系统在企业数据流管理体系中处于核心位置。业务行为相关的数据首先在不同的操作型数据库中进行事务处理OLTP,然后通过ETL工具(提取、转换、加载)汇聚整合成面向主题的、全局的一致数据集合,存储在业务数据临时存储系统ODS中。ODS的数据再次通过ETL工具转换集成为结构化数据进入企业统一的数据仓库。数仓数据针对某个特定主题分类,进入到从属型数据集市。根据企业需要,基于操作型数据库、数据仓库和数据集市也能够构建企业数据湖,存储着包括原始数据、转换数据在内的各种结构化、半结构化、非结构化数据,实现数据的集中式管理。经过汇总后的数据通过OLAP 操作分析处理,并通过BI 工具以体系化、可视化的方式直接呈现在决策者面前,为业务提供数据支撑。

2. 行业集中度

从全球范围来看,微软、Oracle、亚马逊为前三大厂商,占据全球市场接近70%市场份额。2020年微软同比增长超17%,规模首次超过Oracle,主要来自于云数据库的增长。

国内:海外巨头占据市场主要份额,云化和国产替代趋势下海外厂商份额不断下降。2020年国外厂商仍占据我国数据库市场80%以上份额,并已形成较为完善的数据库生态,国产替代安全自主可控下的国产数据库在未来将有很大的市场空间。

中国市场分应用来看,OLTP仍是国外厂商占据最大市场份额,OLAP和非关系型数据库中国厂商具备一定商业基础。OLTP一直由Oracle、IBM DB2、MySQL、SQL Server等占据主导地位,市场份额超90%,而国内阿里的OceanBase、腾讯的TBase、达梦数据库、PingCAP才刚刚起步,TiDB目前是在互联网行业应用较多;OLAP国外MPP架构的Teradata、Greenplum,国产替代厂商有南大通用、人大金仓、天玑等,以及国内星环、中兴、华为等Hadoop数据仓库,以及偶数科技等新一代云原生数据仓库;图分析领域,国外Tigergraph和neo4j为明星厂商,现在中国银联、VISA、Mastercard很多金融机构都在用图分析做风控、做反欺诈,这个领域在未来有很大机会能够实现国产替代。

分行业来看,金融、电信、政府、制造、交通五大行业占据数据库服务市场份额超80%。各行业的数据库服务市场份额比例分别为金融22.3%、电信18.9%、政府16.4%、制造13.3%、交通9.6%(中国信通院统计)。

公有云数据库部分,云厂商份额超70%。2020年,阿里云、腾讯云、华为云等公有云数据库约占国内市场份额75.5%。以电商、游戏、短视频等为主营业务的互联网公司是线上数据库的服务对象。

3. 竞争分析

整体竞争格局

目前我国本土数据库企业类型主要分为四大类,分别是传统厂商、跨界厂商、云厂商以及初创厂商。国内市场主要参与者为海外巨头(Oracle、Microsoft、IBM、AWS 等),国内公有云厂商(阿里云、腾讯云);跨界厂商主要是设备商(华为、中兴通讯);以及新兴数据库厂商(巨杉大数据、PingCAP、偶数科技等);其中,初创厂商主要是最新一代的面向云原生架构的数据库,架构优势更为明显。

传统数据库厂商:达梦数据库、人大金仓、神舟通用等,主要信创数据库公司,占据党政军背景及政策优势,以人大金仓为例,其金仓数据库产品主要应用在党政的办公系统等市场, 2020年实现收入2.41亿元。

跨界厂商:中兴、浪潮、东方国信;利用原有客户及业务基础,叠加销售。

云厂商:占据云生态优势,目前国内全栈的云厂商,使其在软硬件协同方面有机会做一步优化,实现数据库整体性能的提升。

阿里云

2020 年,阿里云宣布进入2.0 时代,架构升级成为云平台+数字原生操作系统。

目前,已有超过40万个数据库实例迁移到阿里云上,包含政务、零售、金融、电信、制造、物流等多个领域的龙头企业。2021年阿里云在产品技术领域进展迅猛。

腾讯云

完备的产品体系+生态合作伙伴。目前,腾讯云已经服务了国内超过70%的游戏公司,市占率行业第一。经过多年积累,腾讯云数据库已经拥有了一套完整解决方案,成功服务的客户数已经超过50 万,其中,90%以上的业务是在亚洲完成的,并且主要在中国。(腾讯云数据库类型主要为云托管数据库)

华为云

数据显示,华为云数据库2019年外部收入相比2018年外部收入实现高达400%的增长;此外,华为云数据库2020年H1外部收入相比2019年H1外部收入实现高达405%的增长。

初创厂商:主打云中立机会以及产品能力

分应用场景竞争情况

OLTP:Pingcap

OLAP:南大通用、星环、偶数科技、Kyligence、StarRocks(原DorisDB)

图数据库:

我国图数据库产品数量为13 款,自研程度较高,自研产品占总数比例为69.23%。从供应商类型看,初创公司、云厂商、高校纷纷入局,其比例分别为7:5:1。

大厂:蚂蚁金服GeaBase,百度安全HugeGraph,腾讯云 TGDB(Tencent GraphDatabase),字节跳动 ByteGraph,华为云GraphBase。

初创厂商:创邻科技 Galaxybase、费马科技、欧若数网Nebula Graph、蜀天梦图、Ultipa图数据库、星环 StellarDB等。

4. 行业的决胜要素

数据库公司的发展遵循内核-外壳-生态的主要路径:内核组件和底层能力为基础,外部组件为支撑,生态为商业化及产品迭代重要路径。

内核层面:底层能力+性能表现为基础。

底层代码积累与产品迭代需要与具体业务场景深度融合。国内厂商诞生之初就面对Oracle、IBM 的激烈竞争,难以拥有接触客户核心业务场景的机会,目前国家要求金融行业全替换,也是针对办公系统的数据库全替换,在业务系统层面更多的是在小业务系统上做实验,现在去谈核心业务系统的数据库国产化还为时尚早。阿里、腾讯的数据库产品之所以能够成为国内代表,依靠的是与自身电商、支付、社交等核心业务场景的不断打磨,而其他数据库公司之前难以拥有这样的机会。因此,厂商要先争取拿到小业务系统的备份系统机会。

大厂拼综合实力,创业公司拼技术,创业公司胜出的要素是产品过硬。数据库云化是关于部署形态、架构形态的问题,但是对底层技术能力的掌握和提升仍然重要。数据库包括数据库内核、分布式组件和接口驱动,SQL引擎、事务引擎和存储引擎,是否支持多副本、分布式事务、高性能、扩展能力、故障恢复、优化器、多活容灾、语法兼容等核心技术。

数据库性能优势也是要素之一。AP场景天然有很多复杂的用户查询,具体到SQL语句上就是大量的多表连接、复杂的表达式计算、多层嵌套的子查询、聚合函数等等,这些对引擎的查询优化能力要求门槛极高。数据分析型基准测试(TPC-H)是公认的衡量数据库数据分析能力的权威标准之一,因此TPC-H测试结果也被作为数据库性能的衡量标准之一。

外壳层面,大数据与数据库一体化趋势明显,需要完善外部组件部分:自研或兼容主流生态组件,完善产品力为进一步发展支撑。

大数据生态中的组件罗列:

生态重要性凸显

国产数据库公司发展的战略重点在生态扩展。做数据库一定要有一个生态,自从X86替换小型机,DB2的市场份额逐渐下降;软硬件分离的趋势,导致Intel、微软的操作系统得以普遍应用,在此生态下才有Oracle、MySQL发展壮大的机会。不同客户核心架构系统不同,存在不同程度的定制化开发诉求。数据库作为基础软件,需要完成芯片、服务器、操作系统、中间件的适配工作,集成商、二次开发商、IT 咨询公司都是数据库厂商生态伙伴体系中的重要参与者,自建生态难度较大,兼容生态为主要选择。生态伙伴赋能企业在快速实现业务扩张的同时最大程度减少成本增长,使得企业能将有限的人员和资金投入到核心技术和核心产品。合作伙伴生态是Oracle早期占领中国市场的核心要素之一,早期Oracle中国区90%以上收入来自2000多个合作伙伴。而2020年中国拥有合作伙伴最多的武汉达梦也仅仅只有101 家合作伙伴。其他的数据库厂商合作伙伴均低于50 家。

出海有助于国内数据库厂商的商业化发展。以 OceanBase 数据库为例,第一大用户是支付宝,但是第三大用户其实是国外的厂商。


声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存