首页  >  行业资讯 >> 信息技术 >> 2023年数据库行业研究报告-1

2023年数据库行业研究报告-1

文章来源:和仕咨询整理 作者:和仕咨询整理 阅读量:505 发布时间:2023-05-22

第一章 行业概况

数据是描述事物的符号记录,具有多种表现形式,包括文字、图形、图像、声音和语言等。数据库是相互有关联关系的若干数据的集合,特点是数据间联系密切、冗余度小、独立性较高、易扩展,并且可为各类用户共享。数据库管理系统(DBMS)是负责数据库搭建、使用和维护的系统软件,通过组织、索引、查询、修改数据库文件,实现数据定义、组织、存储、管理以及数据库操作、运行、维护等主要功能。围绕DBMS构建包含硬件操作系统、数据库管理系统、数据库管理员以及相关机制配套在内的数据库系统(DBS),才能有组织、动态地存储大量相关数据,方便多用户访问。

数据库的不同分类及特点:

按数据结构分:传统关系型数据库,NoSQLee数据库,NewSQL数据库,多模数据库。其中传统关系型数据库在我国市场占比最大,达到约60%。

按部署模式分:云托管数据库,云原生数据库,本地部署,混合部署。

按商业模式分:开源数据库、商业数据库。

按架构分:分布式数据库,单机数据库。

按功能分:OLTP、OLAP和HTAP。

按存储介质分类:内存数据库,磁盘数据库。

关系型数据库的不同分类:

按模型分:关系型、非关系型

按架构分:单机式、集中式、分布式

按部署形态分:本地部署、云部署

2021年中国数据库市场总规模达到286.8亿元,同比增长16.1%,2022年预测市场规模将达到336.1亿元。随着国内外市场上云计算等技术的兴起,国产数据库企业发展快速,达梦、人大金仓、PingCAP、TiDB、阿里云、华为云等成为国产数据库企业的代表。

第二章 商业模式

随着下游企业及需求的不断发展,当前数据库行业主要形成了联机事务处理/数据库OLTP和联机分析处理/数据仓库OLAP两种应用场景。

联机事务处理/数据库OLTP。其应用于面向交易的处理系统、业务系统,典型应用如银行交易系统。其业务在数据库联机的日常操作,通常是对记录进行查询、修改,用户关心快速响应、数据的安全性、完整性和并发支持的用户。数据量方面,每次交易涉及的数据量很小,对响应时间要求非常高,总体数据量相对较小。数据产生于系统中交易本身的数据。使用人员多为操作人员,用户数量极多,以SQL为交互载体,在设计中尽量避免冗余。

联机分析处理/数据仓库OLAP。其应用于分析驱动,是面向信息的分析过程。典型应用如数据仓库。主要是针对某些历史数据进行分析,从而有效地支持投资决策。数据量较为庞大,响应时间与数据量相关,且数据总体规模庞大。数据来源于生产系统操作数据,主要为工作人员使用,用户数量少,支持SQL和其他语言。

一般数据库企业的商业模式大致是:购入服务器等基础设施,完成数据库搭建,扣除生产过程中的机器设备等折旧成本,减去人员薪酬、电费等各类费用,最终出售数据库或提供相关数据库的运营和维护费用获取利润。

数据库企业的利润影响因素:

数据库成品价格及维护运营费用。价格越高,盈利能力越强。

基础设施的价格。数据库的搭建需要依赖于庞大的服务器等基础设施,在当前的数据库服务中占据成本较大比重。

设备折旧、人工费、运营费、运输费等。这些成本费用相对来说比较刚性。

第三章 技术发展

数据库行业作为重要的基础性行业,根本任务在于以最低的资源消耗、最低的生态负载、最高的效率和技术水平为下游相关业务及用户提供数量充足、质量优良的数据库服务,支撑下游企业业务发展、效率提升与管理水平上升,满足国家、社会、发展需要。

1HTAP领域进一步加强APTP之间的融合

2020年以来国产HTAP数据库发展迅猛,几乎成为新兴数据库的必选项。Gartner也指出HTAP已经成为全球范围内新一代数据库的入场筹码,HTAP能力成为数据库重要选项。随着数据技术的不断创新,未来HTAP数据库会进一步加强APTP之间的连接和融合,在数据库内部实现APTP之间的内置流(Streaming)处理能力。通过将ETL工作内置于数据库当中,让HTAP数据库同时具备APTP和流(Streaming)能力。用户可以按需创建各类表,运用流处理能力将表连接,从而获得简单、便捷的数据处理能力。数据库技术的进一步融合会打破当下数据栈的割裂状态,HTAP、流批一体、湖仓一体等技术趋势最终会让数据集中在简单易用、安全可靠、高性价比的数据平台。

2、云计算背景下的分布式前瞻

国产分布式数据库自2019年以来保持高速增长,热度持续高涨。而通过用户调研了解到,面对分布式数据库的故障时,运维人员往往束手无策。主要原因是相较集中式数据库,分布式数据库对IT基础设施可靠性要求更高了,其核心代码主要覆盖了SQL实现和数据存储,而未能自动感知各种对数据库稳定性、性能、并发能力有重大影响的故障隐患,也难以在代码层面对此类问题进行处理,从而实现故障自动规避。未来分布式数据库应提升基础数据探测和分析能力,随时针对出现的异常隐患提前处置,实现无需运维人员过多干预的高效自治运行,让分布式数据库从IT工程化产品变为真正开箱即用的通用型产品。

3、智能运维实现融合智能技术应用下的数据库管理自治

DT时代数据库技术架构和运行环境日趋复杂,种类从单一产品转变为混合型商业数据库和开源数据库组合,依靠人工运维显得捉襟见肘。作为智能化的数据库周边工具,数据库管理平台将机器学习与数据管理在功能上融合统一,利用机器学习增强系统设计开发,以标准化、自动化、智能化的方式提供实时监控、健康巡检、智能诊断、多维分析等数据库管理服务。数据库管理平台的本质是数据库管理经验的代码化,核心方法论是云资源池化、分层解耦以及服务化,实现手段是基于微服务、分布式等云技术实现多元混合数据库环境的统一管理,目标是实现海量数据高安全、高可用、高性能的运维要求,助力数字化转型。

4、数据开源

近年来国内数据库厂商逐步推行开源策略,但是因为开源数据库运行时间短,运营整体表现仍有较大空间。根据开源数据库在GitHub的活跃度细分情况,国内整体水平是低于全球市场开源数据库的整体水平的。

第四章 发展趋势

国产数据库快速发展,风险与机会并存。新兴厂商核心团队普遍来自大厂,技术扎实,经验丰富,产品各具特色,性能较佳,并且资金充裕。但另一方面,国内数据库市场的用户侧呈现风险点,如互联网用户多采用开源或自研数据库而极少使用新兴的产品、新兴厂商难切入政企类用户具备完善的产品和服务生态、缺乏互联网+风口带动市场增量空间、大量中小企业存续不稳定和需求不强烈等问题。数据库厂商纷纷提出出海战略,创业公司自成立之初便定位国际化,但普遍面临信任度、监管、地理位置等障碍,而上云、开源、新技术敏感度成为除基础技术以外,国产数据库顺利出海的关键要素。

云计算上下拉动,云原生优化资源配置。云原生数据库实现了云资源对数据库的细粒度资源拆解。在软件层面,计算层打包SQL语句解析、物理计划执行、事务处理等,共享存储层存放事务日志和数据存储,并通过分布式技术保障高可用和一致性,最后二者采用高速网络互联,通过数据传输协议或其他技术提升I/O性能。

此外,云原生数据库的分层架构还需结合新硬件技术的特性进行重构,如运用可扩展CPU和高主频内核进行算力优化,运用持久内存(PMEM)重构二级缓存以提升I/O密集型场景下的读写性能。未来数据库将进入从硬件平台到架构层再到应用层的全栈优化时代。

数据库与大数据技术边界不断模糊。大数据与数据库分别存在结构化能力差、运算支持能力不足的问题。随着数据技术的发展创新,数据库与大数据技术的边界不断模糊,二者互相延伸。我们认为传统大数据技术有着更为丰富的生态,但是对技术要求较高,相比较而言,从仓向湖的延伸路线,更适合传统企业和中小企业。

Online consultation

在线咨询

咨询热线

010-67280121