AMD数据中心的翻身之战

2014年,AMD任命苏姿丰博士(Dr. Lisa Su)为AMD总裁兼首席执行官;

2017年,AMD携霄龙重回数据中心市场;

2019年,AMD正式发布第二代AMD EPYC(霄龙)系列处理器。

旧金山时间8月7日,当AMD华裔CEO Lisa Su博士一袭灰色职业装出现在发布会现场的时候,现场报以热烈的掌声和尖叫声。随后,她对台下众人打招呼时张开双臂,有如救世主般的存在。的确在某种意义上,她就是AMD的救世主,也被中国A饭们亲切的称为——苏妈。

从之前与黄仁勋的亲戚关系到最近传言的接棒IBM,这位被业界称为“2019全球最佳CEO”的女性并不缺少故事和传说。就在发布会前一天,苏妈才刚刚亲身驳斥了“离职”谣言,并坚信AMD已经进入了“最好的时代”。的确,在她掌舵AMD五年以后,AMD在产品层面终于快要翻身了,可喜可贺。

这并非是AMD历史上唯一的高光时刻。记得2003-2004年的K7时代,AMD很是风光了一把,当年的主打产品AthlonXP速龙处理器更被称为“穷人法拉利”,而将当时能力不济的英特尔奔腾四按在地上狠狠“摩擦”。直到今天,AMD的粉丝们提到这件事的时候还是口若悬河,吐沫横飞,自豪之情溢于言表。

辉煌过后就是黯淡。在随后的日子里,虽然AMD也曾不懈的推出新架构,也曾对“Bulldozer推土机”寄予厚望,但市场对它却并不买账。无论在个人消费市场还是企业级市场中,AMD的日子都不太好过。

成与败不用自己传唱,让他人倾诉

AMD的存在一直是业内的一个特例。就商业定位来说,它所在的核心计算产业玩家并不多,无论是x86芯片还是GPU显卡,每个行业都只有2大玩家,不幸的是AMD一直处于第二的位置。不过以一己之力对抗英特尔和英伟达两大芯片巨头,AMD能够在夹缝中生存下来已属不易。换作其他企业,怕早就在“英氏双雄”的夹击中倒下了。

艰难的生存,挣扎着前进,或许是AMD之前几年的真实写照。有句话说二流企业卖产品,一流企业卖标准,超级企业卖大楼。但在卖掉大楼之后,AMD并没有像诺基亚、索尼、夏普等超级企业那样一蹶不振,而是痛定思痛、决定还是从产品上下功夫。为此,它找召回了曾经开发经典K7/K8微架构的设计师Jim Keller,并选择了半导体行业出身的苏妈出任CEO,也让AMD迎来了“第二个春天”。

现在回头看来,这或许是AMD近十年最重要的决策。回首10年前,当英特尔推出Core核心,并且将其进化为第一代酷睿i7产品之后,AMD就开始了黯淡的生涯,对应在数据中心领域,就是基于Nelame-EP架构的英特尔至强5500系列对于AMD的全面碾压。

由此开始了英特尔近乎10年的黄金时代,AMD甚至一度选择了退出了数据中心市场,躲避英特尔的锋芒。因为在许多业内人看来这个市场的投入成本高、投入时间长、用户回报低。说到底就是三个字——不赚钱。为此,AMD曾在2013年后宣布退出数据中心市场,专注于消费级领域。

这在现在看来无疑是错误的决策,也让AMD将企业级市场仅存的份额拱手相送。虽然就市场份额来说,AMD的占有率肯定不及英特尔,但当时x86平台取代传统小型机已成为行业趋势,如果AMD咬牙坚持下来,纵然在与英特尔的对抗中处于下风,但依然能够抢占从IBM小型机剥离出的不少份额,在数字上也不至于太过难看。但是历史是不能假设的,AMD在纠结再三之后,决定放弃。

这直接导致了AMD在市场中日渐式微,直到苏妈接手的那一天。这位毕业于麻省理工、曾就职于飞思卡尔的高管女博士对于半导体有着充分的技术认知与理解,同时IBM的职业生涯也让她对数据中心乃至企业级市场有着更精准的定位。换句话说,ToB基因已经融入了苏妈的职场血液当中,让她看到了数据中心领域对于AMD的巨大价值——如果说传统消费级市场只是对AMD形成口碑的话,那么数据中心市场也是AMD利润的重要来源之一。于是她下定决心,重返数据中心市场。

点对科技树

邓爷爷教育我们:“科学技术是第一生产力”,对于IT产业来说,科技更是一家公司的核心价值所在。在处理器市场,许多人看到的是英特尔、是高通对于芯片产业的引领,但事实上在开发新技术、引入新技术和应用新技术层面,AMD更多时候扮演了第一的角色。或许我们可以这么说,在IT技术的引入层面,AMD一直是行业的“领航者”。

从最早的64位处理器到整合内存控制器再到最新的PCI-E 4.0技术(这个稍后会有详细分析),AMD一直走在行业前列。当然技术优势要转化为市场优势需要一个契机和过程,可惜的是AMD并不缺乏技术上的领先与创新,但是却一直没有将其转变为市场应用的能力。所以尽管AMD一直很努力的在推动新技术上不遗余力,但是更多时候它还是处于孤军奋战的范畴。

条条大路通罗马

文章写到这里,已经超过了2000字,但是还没有切入产品正题(虽然产品技术特征并非本文重点)。我之前考虑过是否将其分为上下两篇叙述,但是考虑到评论的延续性和态度表达的重要性,最终还是整合在一起。

接下来我们要介绍的,就是本文的核心内容之一、AMD最新发布的产品——第二代霄龙处理器,研发代号为Rome(罗马)。

从名为“巴塞罗那”的第一代四核心处理器开始,AMD就喜欢用地名对其命名,后续包括“上海”、“伊斯坦布尔”和“那不勒斯”等等产品都延续了这一方式。而这一次,AMD对于第二代霄龙处理器的命名为罗马,不知是否取其“条条大路通罗马”的寓意。但是在经过了多年的精心准备之后,Rome的表现实在是让我们觉得惊艳。

AMD对这款产品表现出了前所未有的自信,苏妈在演讲中多次提到了“世界最强x86处理器”的描述。而在官方的新闻稿中,也称其为“现代数据中心的新标准”。从早期的ZEN架构到如今的ZEN2架构,AMD进行了哪些革新?为什么新产品的性能如此强悍?AMD自信的底气源自何方?我们下面将对这些问题一一展开。

产品路线图总是能够最直观的表现每一代之间的差异。2017年,AMD推出了代号为那不勒斯的第一代ZEN处理器(包括后续的升级版本ZEN+),这也被业界视为AMD重返数据中心市场的标志性产品。不过相比老对手英特尔同样基于14nm工艺的SkyLake至强可扩展处理器来说,AMD只是给出了我们另一个选择的可能。

但如今情况就完全不同了。这次AMD发布的ZEN2平台则是基于7nm工艺的,而英特尔年初发布的CascadeLake第二代至强可扩展处理器还是基于14nm工艺(在原有基础上进行了改进),相比之下AMD凭借着工艺的优势在核心、能耗和缓存上的表现更为抢眼。

更可怕的是,AMD下一代的基于7nm升级工艺的ZEN3平台已经在研发中,而英特尔那边……貌似还有1-2代基于14nm工艺的产品。虽然英特尔在本月初发布了基于10nm工艺的IceLake笔记本超低电压版处理器,但是面向数据中心的产品怕是还要再等上至少一年。从前进的脚步来说,AMD已经遥遥领先。

这里我们看到的是处理器架构示意图,左侧的是老版本右侧的是新版本。一个最明显的区别就是,ZEN架构从第一代的“四海一家”变成第二代的“八星伴月”。这更体现出了AMD在芯片设计思路上的转变。

在ZEN2上,AMD使用了Chiplets小芯片的设计思路,通过模块化来组合不同核心的处理器。与以往我们常说的“胶水”不同,Chiplets设计本质上是把不同工艺、不同架构的芯片电路按需搭配,比单纯的胶水封装更有灵活性,当然复杂度也更高。

另一个巨大的变化就是AMD将IO核心单独整合成了一个Die,整合了内存控制器、PCIe控制器等IO单元,使其独立化。因为相对于计算核心来说,IO核心处于辅助的地位,所以在电气性能和功耗要求上更低一些,所以在这部分AMD采用的是14nm的工艺实现。

这种7+14的搭配就为ZEN2架构提供了良好的灵活性。一方面,大小核心的设计使得处理器的制造工艺不必全部拘泥于7nm,在生产工艺和难度上的要求进一步降低;另外在分离之后,核心数量的增加就变得更为灵活,这一代产品提供了从8核心到64核心的超丰富选择,也正是得益于此。(灵活性是如今处理器架构设计的重点,英特尔也先后借助于环形总线Ring Bus和Mesh架构获得更好的核心数量扩展)。

当然作为ZEN2最大的产品特征,7nm无疑是本次发布的亮点,但14nm仍有适用的领域。在发布会当日上午举行的闭门“架构深度沟通会”上,我们了解到,ZEN2 通过Chiplet的设计方式证明7nm CCD(Core Complex Die) Die+14nm I/O Die的做法在控制成本和性能突破之间取得了平衡。

中国有句老话,叫做“甘蔗没有两头甜”,对应到外国就是“欲戴王冠,必受其重”。在分立IO核心带来好处的同时,AMD也需要解决延迟的问题,为此也才有了第二代的Infinity总线改进。

Infinity总线实际是由传输数据的Infinity Scalable Data Fabric(SDF)和负责控制的InfinityScalable Control Fabric(SCF)两个系统组成,我们或许可以将Infinity SDF比作芯片运输数据的血管,而将Infinity SCF比作芯片的神经。其中,Infinity SDF在片上(on die)和芯片间连接(off-die)有两个不同的系统。片上的SDF在芯片里将CPU核心、GPU核心、IMC等连在一起,而芯片间的SDF负责在封装上将不同的die连在一起,或者多路插槽连接。

在这一代的ZEN2产品中,Infinity总线进化到了第二代,在并行、延迟及能效上全面改进,总线位宽从256b升级到了512b以便支持PCIe 4.0,同时将Fclk与Uclk频率去耦合解锁以提高内存超频性能,并采取多种方式降低内存延迟、提高缓存速度以减少延迟带来的影响。

ZEN2带来的另一大特性就是整合了PCI-E 4.0标准,也成为了在x86平台上第一个提供该标准的厂商。其实早在小型机平台,IBM POWER9处理器早些年就宣布支持PCI-E 4.0,不过因为小型机的受众范围很小,许多人不得而知。事实上,PCI-E 4.0的技术标准早已成熟,只是因为众所周知的原因一直没有推向x86市场,而AMD迈出了这一步。

相对于当下的PCI-E3.0标准来说,PCI-E 4.0在性能上提升了一倍,从8Gbs翻倍到16Gbps,同时提供了64GB/s的带宽。结合刚刚我们提到的Infinity总线,在两个全新的产品加持下,新ZEN2平台的传输性能会有巨大的提升,按照官方的说法就是“获得同类产品最高的I/O和内存带宽……释放服务器的性能”。

在微架构层面,ZEN2依然带来了全新的提升,在前端设计上它从Zen时代的4路256组64KiB L1缓存变成了如今的8路64组32KiB缓存。对此AMD的说法是,通过减小指令缓存的大小来获得更好的单位面积性能。缓存小了但是通道多了,意味着单位时间内效率的提升。

改进的分值预测单元、更好的指令预取、重新优化指令缓存、更大的微指令缓存……等等项目的变化带来的是直接的性能翻倍与延迟的同时降低,这些都意味着ZEN2的脱胎换骨。在上一代的ZEN架构中,这前端设计一直被认为是其软肋所在,还好AMD在这次更新上有了明显的进步。

具体到产品层面,ZEN2系列面向主流双路一共有14款产品,看起来并不多(年初英特尔发布的第二代至强可扩展处理器数量多达40余款),但是其规格覆盖了从8核心到64核心的超广阔范围。更值得一提的是,在缓存容量上ZEN2带来了“海量”提升,动辄128MB的三级缓存无疑在大容量吞吐的时候受益多多,更遑论最高256MB的缓存。

无论是AMD还是英特尔,都伴随着核心数量的增长,让我们来看看他们的功耗。因为集成了太多的核心,ZEN2的TDP功耗最低120W,其主流产品功耗集中在170-200W之间,最高的64核心产品功耗达到了225W。不过要是考虑到英特尔至强9282铂金版400W恐怖功耗的话,ZEN2也还算是小巫见大巫。

介绍了这么多架构的变化与指标的革新,是时候看看第二代 AMD EPYC处理器真正的实力了。在发布会现场的展厅里,AMD可谓是做足了功夫。一方面它邀请到了众多的合作伙伴展台,另一方面则是展示出了从BenchMark到实际业务的不同应用成绩,以全方位的表现ZEN2平台的强大性能。作为性能介绍的开场,我们先来看看这个视频——

许多人对这项测试都不陌生,早在去年CES展会上苏妈就演示过这个测试,对比的是英特尔当年的至强8180平台。随后,在年初英特尔新品发布的时候,又把这个测试翻了出来,不过主角换成了刚刚我们提到的恐怖400W“怪兽”至强9282。如今第三次,AMD又拿出了这项测试,不过对标产品换成了自家的ZEN2 7742。

结果是显而易见的,双方的多轮博弈,让我们更清楚的看到了不同时代顶尖处理器的性能成长。不过对于客户来说,BenchMark成绩只能进行参考,具体的表现还要在实际的业务中才见分晓。为此,AMD还展示了在Spark环境中ZEN2的性能优势。

Spark是大数据应用的常见架构,在数字化、数据分析的今天,它的应用范围非常广。这段视频主要演示的就是在这个架构下不同处理的性能。可以明显的看出,ZEN2平台的效率更高一些。16秒34对20秒30,性能提升大概20%。

ZEN2带来的性能提升有多大呢?在苏妈的演讲中,分享了一张基于SPECCPU 2017软件的测试成绩。这款软件是业内公认的、CPU测试的主流软件,而在测试结果上,英特尔与AMD的表现让我们大跌眼镜。

针对单插槽处理器性能来说,ZEN2的性能是英特尔产品的两倍以上,我们可以看到即便是铂金版产品其实际得分也仅相当于32核心的中端ZEN2处理器水平,在中高端的48核心和顶尖的64核心处理器上,ZEN2目前还没有对手。

这也说明,AMD对于英特尔至强CascadeLake的性能起到了全面碾压的效果,甚至出现了“以一敌二”仍有盈余的情况,这是前所未有的成绩。之前,英特尔与AMD的竞争只是在某些领域互有胜负,也出现过英特尔全面压制AMD的情况。但是AMD却从没有今日这般强大,这得益于架构的改进,同时也得益于制程的先进。

可以说,AMD在对的时间选择了对的技术和工艺,打了一个时间差,让英特尔措手不及。从产品性能角度,AMD并没有吹牛,的确是世界最强的x86处理器,也的确实现了性能上的翻身。

在演讲的最后,苏妈用了“you have to”这个词来总结购买AMD第二代霄龙处理器的原因。有初中英语水平的小伙伴们就应该知道,“have to”代表了“不得不”的意思,在英文语境中属于措辞比较严厉的用法。而对于客户来说,是什么使得他们“have to”购买AMD平台,他们有没有其他的选择呢?这个答案……继续往下看。

没有生态,再好的平台也是空中楼阁

数据中心市场并非是性能的天下。如果是个人消费品,无论是手机还是笔记本,只要在性价比之间找到平衡,通过品牌传播影响到最终消费者就可以有出色的市场表现,小米手机的一飞冲天就是最好的证明。但是在企业级,无论是技术还是价格都只占了很小的一个比例,品牌口碑、产品性能、易用性、兼容性、可靠性、安全性、生态伙伴的支持乃至于有说服力、重量级的客户案例,都会影响到最终客户的买单意愿。这是最大利润的市场,却也是最难攻破的堡垒。在下决心重返数据中心市场之后,AMD就一直努力经营自己的“生态圈”,寻找各个层面的合作伙伴。

在发布会当天,包括AWS、谷歌、微软、Twitter等众多互联网企业集体亮相,为AMD站台。在官方的介绍中,将其称为“空前壮大的数据中心产业链合作伙伴”。除了美国企业之外,包括百度、腾讯在内的许多中国互联网企业也开始进入AMD的阵营。让我们来看看下面这个冗长的名单——

AWS代表对于第二代 AMD EPYC处理器给与了高度肯定,他尤其提到了包括SAP数据库、HPC、AI等多项应用;

谷歌表示会将第二代AMD EPYC处理器应用在谷歌云上;

Twitter宣布将借助于部署第二代 AMD EPYC处理器减少 25% 的总体拥有成本;

微软宣布即日起为全新Azure虚拟机开始提供预览;

HPE宣布推出三款基于第二代AMD EPYC处理器的产品,包括DL325、DL385和Apollo 35服务器(HPE命名中以5结尾代表了AMD平台);

联想也表态将在ThinkSystemSR655和SR635中采用新平台;

……

类似的企业还有很多。似乎一时之间,AMD成为了众多行业解决方案提供商的新宠,无论是OEM、ISV还是最终用户,都对AMD有了全新的期待,也愿意张开怀抱来拥抱它。至少在目前看来,一切对于AMD都非常有利,AMD多年在行业所深耕的结果,正在一点点显现出来。

这当然也或多或少包括了整个行业对于英特尔的厌倦。在坊间,英特尔推出产品的节奏被人称为“挤牙膏”,这很大程度上也由于AMD在竞争方面的不利。而如今在新生代产品的感召下,大家纷纷站出来加入AMD阵营,个中滋味也是不难体会。

当然更重要的还是AMD与英特尔在架构上的同种同源。虽然在微架构设计层面有所不同,但整体看来AMD与英特尔都基于x86阵营,因此在生态上AMD也同样能搭上x86架构的顺风车,形成了生态伙伴“召之即来”的壮丽场面。相比之下,曾同样与英特尔展开竞争的POWER和ARM都不具备这样的优势,自然在生态系统建设上也就处于劣势。

不过这并非意味着AMD将很快出现遍地开花的局面。事实上,虽然众多合作伙伴都在为AMD站台,但在实际业务中的应用规模和采购力度依然是我们关注的问题。按照惯例,即便测试成绩出色,但这些客户在业务部署上依然是谨小慎微的,初期的AMD能够在局部业务的局部应用上实现突破,就已经是难能可贵。

AMD翻身了,英特尔向何处去?

在美国大会的现场,我还遇到了两位老朋友,来自HPC wire杂志的主编Tiffany和来自STH网站的主编Patrick,两人都对第二代 AMD EPYC 处理器给与了“Very very Good”的超高评价。不过考虑到美国人说话一向比较夸张,最初我对他们的描述并不敢肯定。“真的,我们测试过,至少提升25%”, Patrick说这话时的兴奋溢于言表。

伴随着新消息的发布,同样的喜悦情绪在论坛、贴吧和知乎上弥漫开来,甚至早在消费类ZEN2发布的时候这种情况就已经酝酿而成,并且伴随着时间的延续不断发酵。“AMD,Yes”的呼声也是不绝于耳。在许多人看来,AMD这次要真的实现翻身了,而之前那个我们曾津津乐道的英特尔,如今正在角落里瑟瑟发抖(其实也不至于)。

鉴于第二代 AMD EPYC处理器的强劲性能,包括苏妈在内的许多AMD高层都对其发展表达了乐观的态度。在发布会后的采访中,AMD全球副总裁兼数据中心产品部总经理 Scott Aylor 讲到:“我们的CEO Lisu Su博士在今年的第一季度,曾经做过一个公开的表述,提到我们的目标是在未来的几个季度实现双位数的市场份额。我们非常期待第二代EPYC会成为我们市场份额增长的助力。”

在苏妈现场的演讲中,更展示了第二代 AMD EPYC 处理器相对第二代至强可扩展处理器的优势。在同样的性能表现上,AMD产品的价格只有英特尔平台的四分之一,能耗表现只有英特尔平台的一半。“努力真正得到回报”(Effortsreally paid off),苏妈说。

这注定是一条艰难的路,AMD将在高端应用层面与英特尔展开直面的竞争,面对的则是至强金牌、至强铂金处理器以及背后庞大的生态和服务系统。虽然AMD展示的测试成绩在高端领域具备了明显的优势,但是金融电信更在乎的是可靠性、安全性和可用性,是5个9、6个9之类的安全标准,并非是单纯的测试数据那么简单。

由此看来,虽然AMD“翻身”已成为板上钉钉的事实(至少在性能上),但是对于“翻身”的程度我们还需要进行评估和考量,这也要靠市场去检验,AMD和英特尔说了都不算。

所以我们现在只能说,AMD有了翻身的资本和姿态,并且正在打一场“翻身仗”。战斗的结果,让我们拭目以待吧!

在发布会的主题演讲中,苏妈提到了这样一句话——Change the game in datacenter。许多人看来,这一次ZEN2的发布是AMD的翻身仗,也的确因为ZEN2的性能大家有目共睹,在现有的环境中表现出无比强悍。但是我想,苏妈这句话的另一层含义不仅仅在于领先并击败英特尔,而是另有所指。

一直以来,英特尔都是x86平台的领军者,无论AMD采用了何种新技术,这个市场依然是英特尔在主导。但是现在,AMD在性能上再一次获得了领先,而英特尔下一代的10nm产品却刚刚萌芽,市场留给了AMD一个绝佳的时间差。此时,AMD所需要实现的不仅仅是迎头赶上和超越,而是更进一步,走出自己的路。

真正的将军从不在敌人设计好的战场与之决战,而是沿着自己的节奏稳扎稳打,即便ZEN2获得了巨大的成功,以AMD的体量来说也不太可能对英特尔取而代之。AMD更需要实现的是利用这个时间差,在细分领域找到适合自己的业务,打造自己的生态圈。去年年底,英特尔将业务发展定位成了6大支柱,包括制程、封装工艺、存储、互连、软件和安全,并视其为生命线。由此看来,处理器虽然是英特尔的核心,却也并非是决定性的业务,而AMD显然也有自己的业务支柱,并不能简单套用这6个标准。

或许在未来,AMD与英特尔都能够有自己的差异化产品路线,可能英特尔在物联网方面多点开花,可能AMD在视觉应用领域硕果累累,还可能在5G时代会有更多新的需求和业务驱动。Anyway,市场留给两者的机会多多。相对于英特尔多年来的“一枝独秀”,市场更需要有AMD这样的百花齐放才是。

事实上用户对于数据中心的需求也越来越明确。在云计算的大潮下,基础设施建设服务提供商已经越来越步入后台,正如我们在用电的时候不会在乎它是否来自国家电网一样,数据中心的前端客户也不在乎计算能力是由哪家处理器提供的,英特尔不错AMD也挺好,甚至包括POWER、ARM等等也都可以接受,只要能够解决实际业务难题。

还是邓爷爷说的好——不管白猫黑猫,抓住耗子就是好猫。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190812A0JEKX00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券