我正在收集数据来比较CPU和GPU GFLOP的性能,我目前关注的是双插槽CPU (E5-26xx系列),然而,在Broadwell之后出现了Skylake架构,它拥有青铜和银牌双处理器系列,但它们的内核和性能是Broadwell的一半。我是不是遗漏了什么?
发布于 2018-02-20 04:21:45
有趣的是,看起来你是对的,只有高核数的Skylake服务器芯片也能够在4插槽系统中使用。(https://en.wikichip.org/wiki/intel/microarchitectures/skylake_(server)#Brands
您可以在双插槽系统中放置黄金/白金CPU。我假设你在高核心数量的CPU上花费的大部分是核心/缓存本身,所以在双插槽系统中使用它们并不是一种浪费。
SKX使用UPI代替QPI作为套接字之间的互连。具有2个UPI链路的CPU可以在4P系统中使用,形成一个环,而不是每个CPU中有3个链路的全对全。或者2P系统可以使用两个套接字之间的所有3个UPI链路来获得更多带宽。(Wikichip has diagrams
青铜/银牌和金牌5xxx CPU有2个UPI链路,而金牌6xxx和白金CPU有3个UPI链路。(wikipedia
在每个Skylake-SP CPU内部(在单个芯片上),内核之间的互连是网格,而在Broadwell和更早的版本中是环形总线。
4P/8P Broadwell (及更早版本) Xeons具有小型(14kiB?我现在找不到更详细的描述) snoop filter cache (参见John McCalpin's post in this thread,但2P芯片没有,并且当加载在L3中未命中时,当它们从本地动态随机存取存储器加载时,只是将snoop请求广播到其他套接字。这“只占用了QPI带宽的一小部分”。(确切的窥探行为是configurable with different modes,以优化低延迟本地内存与较低延迟的远程内存,等等)。
因此,在Broadwell和更早版本的2P和4P/8P芯片之间存在硬件差异(不仅仅是人为的营销/市场细分),并且具有相同的核心数量。
Skylake-SP始终有一个监听过滤器。请参阅Intel's paper on Skylake-Xeon internals中的基于目录的一致性部分。
(请注意详细信息。也许铜牌/银牌较弱,但他们的营销部门认为,在金牌中进行更细粒度的市场细分是不值得的。)
发布于 2018-02-20 03:34:40
在英特尔CPU代码名方面,您不会遗漏任何内容,但您关于“性能减半”的说法并不明确。特别是,您比较了哪些确切的SKU?还有,为什么你选择准确地比较不同世代的产品?官方数据库在http://ark.intel.com,在那里你可以找到不同代的相同细分市场的模型。
https://stackoverflow.com/questions/48872306
复制相似问题