作为一名数据行业从业者,经常会关注市场行业的一些变化。特别是近期,明显感觉到数仓这一分支领域正在悄然发生一些变化。从其最大的头部玩家-TeraData的变化可见一二。下面谈下我对这个现象的个人看法。
1. 数仓市场整体情况
1).主要玩家变化
首先我们先从数据行业的整体情况入手。在下图中,按照两个维度针对场景做个划分,其内部标识部分主流厂商。纵向按关系型与非关系型,横向按照操作型与分析型做了划分。重点关注下右上角分析市场的情况。在这里的玩家,按厂商定位大致分为两类。一类是老牌的数据库厂商,以TeraData、IBM、Oracle为代表;一类是新兴云服务商,以Google、Amazon、Azure为代表。此外还包括右下的一些大数据厂商,也可在数据分析场景中使用。
针对非云服务商,可以简单整理为下表。可以看到主要是以老牌传统厂商为主。而且很有趣的现象是,除了TeraData外,基本都是巨头厂商收购产品形态为主。这些厂商在过去的近二十年里成为数仓领域的主导性力量,满足了广大企业级用户的数据分析诉求。但这一现象,正在最近几年发生不小变化。
下面我们从数据库排名角度,看看两类玩家的趋势变化。下图中根据最新的DB-Engines Ranking的数据进行近十年的趋势变化分析。对比以TeraData、Vertica、Netezza为代表的传统厂商,和以Google BigQuery、Microsoft Azuere Data Warehouse、Amazon Redshift为代表的云服务厂商。从绝对数字可见,传统厂商仍然领先(特别是TeraData,领先明细);但从增长趋势来看,后者涨幅更为快速。在2020年,主要厂商已经开始交叉,相信不久之后将全面超越并逐步逼近TeraData的领导地位。
从明细数据中,也看到类似的趋势。传统厂商趋稳,云厂商则快速增长。
2).市场规模变化
我们以大数据整体市场(含数据分析)来看。下图是全球的市场规模的变化。在从软件、硬件、服务三者来看,整体市场规模从2016年的280亿美金预测到2024年增长到830亿美金。在三者比例中,软件部分增长更快。
再看看我们国内市场的变化,下图是IDC的预测报告。整体增长趋势比较平稳,但对比全球增长要更为迅速,在未来的3、4年将占到全球整体市场的1/4。从行业来看,互联网、政务、金融是未来的三大市场。
3).技术发展变化
从技术发展来看,走过了OldSQL->NoSQL->NewSQL的道路。
2. TeraData厂商情况
TeraData作为市场的头部玩家,重点分析下它的情况。
1).公司概况
Teradata天睿公司(纽交所代码:TDC),是美国前十大上市软件公司之一。经过逾40 年的发展,Teradata天睿公司已经成为全球最大的专注于大数据分析、数据仓库和整合营销管理解决方案的供应商之一。Teradata天睿公司在全球拥有近两万名员工。在大中华区拥有超过1200名员工,涵盖市场、研发、技术和解决方案推广、销售、咨询服务、售后技术支持,及在大连的全球咨询中心等业务。服务了超过十多个行业的客户,包含政府与公共服务、通信行业、银行、保险、证券、航空、地铁、交通运输、物流、快递行业、制造行业、汽车、零售、电子商务、互联网、电力能源等等。其核心产品为TeraData数据仓库。
2).行业地位
在2019的Gartner报告(2020还没出)中,TeraData作为专注于数据分析的厂商出现在领导者象限。并在单一领域保持了十余年的领先地位。
3).经营情况
作为一家上市公司,我们可从其披露的数据看下公司经营情况。从最基本的股市表现来看,其近两年估值下滑严重。在最近的一年中,有超过30%的下滑。
在从其财务报表数据来看,近期变现很差。
4).技术特点
下图是其技术架构,其是一个典型的MPP架构产品。
参阅了Gartner的内部评测报告,TeraData在Traditional Data Warehouse、Real-Time Data Warehouse、Logical Data Warehouse、Context-Independent Data Warehouse的评测中,均是排名第一。在同行业中,可谓遥遥领先。但这样一款技术突出的产品,为何在近年经营表现这么差,非常值得深思。这里不仅联想到这两天的另一个巨头厂商-Oracle的财报披露,下滑明显。当然,这里有很大一部分受疫情影响,但其软件业务下滑,云业务迟迟不见起色,也不无相关。
3. 国内行业变化
那么回到国内,近年来国内客户在数据仓库领域,又有什么新的变化呢?我简单总结了几条: