首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >英特尔至强Broadwell双处理器之后会有什么变化?

英特尔至强Broadwell双处理器之后会有什么变化?
EN

Stack Overflow用户
提问于 2018-02-20 02:39:31
回答 2查看 295关注 0票数 0

我正在收集数据来比较CPU和GPU GFLOP的性能,我目前关注的是双插槽CPU (E5-26xx系列),然而,在Broadwell之后出现了Skylake架构,它拥有青铜和银牌双处理器系列,但它们的内核和性能是Broadwell的一半。我是不是遗漏了什么?

EN

回答 2

Stack Overflow用户

发布于 2018-02-20 04:21:45

有趣的是,看起来你是对的,只有高核数的Skylake服务器芯片也能够在4插槽系统中使用。(https://en.wikichip.org/wiki/intel/microarchitectures/skylake_(server)#Brands

您可以在双插槽系统中放置黄金/白金CPU。我假设你在高核心数量的CPU上花费的大部分是核心/缓存本身,所以在双插槽系统中使用它们并不是一种浪费。

SKX使用UPI代替QPI作为套接字之间的互连。具有2个UPI链路的CPU可以在4P系统中使用,形成一个环,而不是每个CPU中有3个链路的全对全。或者2P系统可以使用两个套接字之间的所有3个UPI链路来获得更多带宽。(Wikichip has diagrams

青铜/银牌和金牌5xxx CPU有2个UPI链路,而金牌6xxx和白金CPU有3个UPI链路。(wikipedia

在每个Skylake-SP CPU内部(在单个芯片上),内核之间的互连是网格,而在Broadwell和更早的版本中是环形总线。

4P/8P Broadwell (及更早版本) Xeons具有小型(14kiB?我现在找不到更详细的描述) snoop filter cache (参见John McCalpin's post in this thread,但2P芯片没有,并且当加载在L3中未命中时,当它们从本地动态随机存取存储器加载时,只是将snoop请求广播到其他套接字。这“只占用了QPI带宽的一小部分”。(确切的窥探行为是configurable with different modes,以优化低延迟本地内存与较低延迟的远程内存,等等)。

因此,在Broadwell和更早版本的2P和4P/8P芯片之间存在硬件差异(不仅仅是人为的营销/市场细分),并且具有相同的核心数量。

Skylake-SP始终有一个监听过滤器。请参阅Intel's paper on Skylake-Xeon internals中的基于目录的一致性部分。

(请注意详细信息。也许铜牌/银牌较弱,但他们的营销部门认为,在金牌中进行更细粒度的市场细分是不值得的。)

票数 3
EN

Stack Overflow用户

发布于 2018-02-20 03:34:40

在英特尔CPU代码名方面,您不会遗漏任何内容,但您关于“性能减半”的说法并不明确。特别是,您比较了哪些确切的SKU?还有,为什么你选择准确地比较不同世代的产品?官方数据库在http://ark.intel.com,在那里你可以找到不同代的相同细分市场的模型。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/48872306

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档