巨头们都要抢占的XPU道路,真的有这么香吗?

在芯片领域有这么一句传言:

每过18天,就会出现一个新的XPU。

曾几何时,一个CPU打天下的时代早已不复存在了。

……

三巨头的XPU征途

很久很久以前,CPU还长这样。

1971年,英特尔发布世界上第一块微处理器CPU-4004。

被誉为“人类历史上最具革新性的产品之一”。

接着8008、8088、8086相继跟上,正式开启了以微处理器为计算机中央处理器的时代。

英特尔也因此坐稳了领头老大的位置,一骑绝尘。

然而随着互联网的高速发展,我们发现,在处理大规模与高速数据时,CPU很难满足需要。

于是它的小弟——GPU,隆重登场了!

在英特尔还在“继续做大做强CPU”和“去GPU市场试试水”之间徘徊不定时,

英伟达已经在GPU领域站稳了脚跟。

2009年末,英特尔“痛下决心”宣布取消Larrabee图形芯片项目,

彼时的英伟达已经推出Tesla,并大举进攻。

更不用提那个戏剧般的2006年——那是值得AMD一直吹牛到今天的一年。

这一年AMD以54亿美元的价格收购了ATI公司。

自此踏上了“两手都要抓,两手都要硬的道路”。

就这样,左手CPU,右手GPU,AMD“扬言”拳打NVIDIA,脚踢英特尔。

虽然英特尔曾信誓旦旦表示不做独立显卡,但真香定律适用于全人类,企业也不能例外。

尤其是AMD“大放厥词”在前,英特尔怎么能忍得下这口气。

果不其然,从2015年开始,英特尔开启“买买买”模式,疯狂拓展XPU领土。

  • 2015年收购FPGA供应商Altera,
  • 2016年收购AI芯片供应商Nervana,
  • 2017年收购自动驾驶视觉处理公司Mobileye和AI芯片供应商Movidius,
  • 2018年收购eASIC,
  • 2019年收购云端AI芯片供应商Habana Labs,
  • 2021年收购RISC-V指令集架构的开发商SiFive。
  • ……

自古以来,金钱的力量往往都是不容小觑的,

英特尔的疯狂输出成功帮助它打造了一支“CPU+GPU+加速器+FPGA”的XPU队伍,

并且这个队伍还在不断扩充中,比如又一个新名词:IPU。

眼看“好兄弟”都在为开疆扩土一掷千金,英伟达也按捺不住了。

凭借一系列的收购,英伟达打出了一套CPU、DPU和GPU的“组合拳”。

CPU、GPU、DPU、IPU,还有没出场的TPU、NPU、APU等等,

巨头们一直锲而不舍地创造新名词,XPU的队伍不断扩大,

或许在不久的将来,26个字母将被全部用完。

下面一起来简单看看这些XPU家族吧。

CPU

CPU—— Central Processing Unit, 中央处理器,

CPU之于计算机、服务器,也就相当于大脑对于人类的作用。

计算、控制、存储是CPU“大脑”布局谋略、发号施令、控制行动的主要表现形式。

CPU 是对计算机的所有硬件资源(如存储器、输入输出单元) 进行控制调配、执行通用运算的核心硬件单元。

CPU 是计算机的运算和控制核心。

如下图所示,CPU主要包括了计算单元、控制单元和存储单元:

我们可以很明显的看出,CPU的计算单元在整个结构中占比很少,

故而相对于大规模并行计算能力,CPU更擅长于逻辑控制。

随着人们对更大规模与更快处理速度的需求的增加,CPU渐渐力不从心。

因此,GPU,它来了!

GPU

GPU——Graphics Processing Unit,图形处理器,

跟它的名字一样,GPU最初是用在个人电脑、游戏机和一些移动设备上运行绘图运算工作的微处理器。

GPU的构成相对简单,有数量众多的计算单元和超长的流水线,特别适合处理大量的类型统一的数据。

不过GPU生来就是做小弟的命,不能单独工作,必须由CPU进行控制调用才行。

GPU的工作大部分都计算量大,但没什么技术含量,而且要重复很多很多次。

当CPU需要大量的处理类型统一的数据时,就可以调用GPU进行并行计算。

不过,GPU虽然叫图形处理器,但并不是只能处理图像。

GPU虽然是为了图像处理而生,但在结构上并没有专门为图像服务的部件,只对CPU的结构进行了优化与调整,

因此GPU可以被认为是一种较通用的芯片。

目前科学计算、密码破解、数值分析,海量数据处理等需要大规模并行计算的领域都有GPU的身影。

TPU

TPU——Tensor Processing Unit, 张量处理单元,

TPU是由Google设计的定制机器学习芯片,用于执行其常规机器学习工作负载。

起初机器学习以及图像处理算法大部分都跑在CPU与GPU上面,

但这两种芯片本质上是通用性芯片,在效能与功耗上不能紧密适配机器学习算法,且价格也比较贵,

TPU便就此诞生了。

TPU是一种ASIC芯片,即应用型专用集成电路(Application-Specific Integrated Circuit),是一种专为某种特定应用需求而定制的芯片。

据称最早的TPU就比同期的标准CPU和GPU快15-30倍,效率(性能/瓦特)提升 30-80倍。

目前谷歌已经发布了第四代TPU,据称TPU v4每秒能够实现10万万亿次运算,将于今年向谷歌云用户提供服务。

DPU

DPU—— Data Processing Unit ,数据处理单元,

DPU是面向数据中心的专用处理器。

CPU用于通用计算,GPU用于加速计算,而数据中心中传输数据的DPU则进行数据处理。

简单来说,CPU做不好,GPU做不了的那些计算任务,交给DPU就完事儿了。

有人说,DPU正在取代CPU作为数据中心服务器的中央控制点,建立以数据为中心的计算架构。

英伟达首席执行官黄仁勋将DPU称为“未来计算的三大支柱之一”。

要说带货还得服老黄,DPU的概念才提出没多久,

从国外巨头大佬英特尔、博通、英伟达、赛灵思、Marvell,

到国内的创企中科驭数、星云智联、芯启源等等,都纷纷陷入了DPU热潮。

XPU全家桶:前途漫漫,挑战不绝

随着5G、AI等新技术不断发展,计算场景也更为丰富多样,XPU的发展成为大势所趋。

许多半导体巨头厂商都推出了多元化的芯片产品,不断充实自己的XPU“全家桶”。

不少创新公司同样不甘示弱,也纷纷推出了专属芯片产品,

整个芯片市场迎来“百家争鸣”时刻。

然而值得注意的是,XPU不能仅仅是XPU,

它不是硬件简单的物理堆砌,而要考虑到其中的互联互通,跨架构的软件协同,

只有软硬件协同发展,才能更好发挥出产品应有的价值。

同样,技术创新还需要匹配用户的实际需求,这样才能在市场中打造自己的一番天地。

  • 发表于:
  • 原文链接http://news.51cto.com/art/202109/682725.htm
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券