现代数据中心标准COTS服务器的演进

数据中心内的x86商用成品(COTS)服务器的标准化已经经过了很长时间,因为该架构提供了多功能、低成本、易于集成、更有效地维护和管理配置文件,总而言之,其成本低于专用硬件的方式。但目前业界出现了驱动数据中心服务器选择的新的需求,即需要数据中心服务器能够支持运营商的虚拟化、可编程性以及机器学习和高级实时分析带来的大量的数据集。

网络功能虚拟化(NFV)和软件定义网络(SDN)逐渐在数据中心中得以实现,底层硬件已经逐渐从运行的智能软件中抽象出来。

IDC全球基础设施实践项目主管Ashish Nadkarni表示:“数据中心的选择是基于标准化的理念,其目标是实现软件层的智能化,远离硬件的专业化。每个用户都在使用业界标准的芯片而不是定制化的芯片,以便通过简单地替换软件堆栈,可以使用类似的服务器来实现多用途。应用程序本身逐步得到虚拟化,并通过编排层实现服务器之间的迁移。”

理论上来看,这应该会加强COTS的趋势,在某些用例中,大的I/O性能需求推动用户转向使用专有硬件,因为使用纯粹的“白盒”不能满足下一代网络架构的需求。

Nadkarni表示:“当用户拥抱通用的硬件时,它是不合适的。因为标准的CPU虽然能够实现很多功能,但在任何方面它都不能做到最好。用户采取这种方式可以提高效率,但其性能并不能支持NFV或认知计算。”

性能提升的需求

NFV和SDN可能是最显著的工作负载,使可用的COTS服务器性能受到限制,但是下一代工作负载的范围和需求要远超于传统数据中心的架构:在大数据分析实施中实现大型数据集和动态实时应用程序;AI(人工智能)、机器学习和认知计算环境;安全。这些应用都需要提高I/O性能,以提供最佳的最终用户体验,这意味着服务器必须具备高性能、低延迟和高速缓存一致性。

IHS Markit云数据中心研究实践高级研究总监兼顾问Cliff Grossner认为:“电信运营商和大型服务提供商对数据包处理的要求与传统数据中心的需求大不相同。这些环境中的很多应用程序都是数据包处理应用程序,当我们考虑到下一代产品和网络时,他们需要加速和提高数据包处理平面性能的策略。”Cliff Grossner认为这不是一个单独的问题,而是当AI技术成为产品组合的必要组成部分。

他说:“用于分析和AI应用的代码处理器将在电信和NFV中大量使用,电信运营商和其他厂商将使用遥测技术来改善用户体验并提高用户的自主性,这些算法可以从加速中受益匪浅。随着服务器的发展,服务器将拥有越来越多的核心处理器,可以一次处理多个数据点,从而加快重复计算速度。”

调整服务器

如果要支持这些新的业务模式需要通过数据平面开发套件(DPDK)调整通用CPU,以优化高级用力。这是Intel青睐的一种方式,它涉及到一个优化应用程序与网卡(NIC)通信数据路径的编程架构。通过这种方式,它能够更快地处理数据包,这对于处理大量以太网数据包处理或高消息速率的应用程序,如虚拟网络功能(VNF)尤为重要。

另一个方式是实现硬件加速的智能网卡,由Mellanox,Cavium和Netronome等公司目前提供这样的智能网卡。这些网卡上的SoC能够支持服务器在网卡上运行数据包转发平面,从而从CPU中卸载该工作负载,释放资源并提高性能。

Grossman表示:“10到15个内核中的任何工作都可以通过数据包处理来实现,因此可编程的网卡可以让CPU自由地执行其他操作,这些可以在白盒上或其他服务器上实现。”

Nadkarni表示:“这使得服务器非常标准,但是用户可以使用定制化的硬件来扩充服务器。”

开源持续成熟

服务器的发展过程中另一个重要因素是开源的持续成熟。未来的服务器可能会通过高速架构连接多个加速处理组件,这将推动对标准化的需求。为此,OpenCAPI于去年秋季推出,作为新的接口标准,可使诸如FPGA、图形、网络和存储加速器等高性能加速器以高性能的方式与服务器通话。与早期的PCle 3方式相比,OpenCAPI具有25 Mb/s的数据传输速率,PCle 3的传输速率只有16 Mb/s。

然后可以在配置中实现OpenCAPI和其他的开放标准,例如Rackspace和Google最近公布了OCP的OpenPower服务器平台,代号为Zaius和Barreleye G2.与以前的OpenPower系统相比,Zaius将CPU性能和内存容量提高了一倍,并且还增加了外设带宽。它依靠OpenCAPI将GPGPU、FPGA和其他专业处理器结合在一起,并使他们能够更快更方便地进行编程。

由于高级用例没有显示采用减速的迹象,因此平衡数据中心性能与提高标准服务器效率将是一个挑战。例如,可以通过诸如内存总线、大型高速缓存和高频、高功率处理器等增强功能来提升性能,但在某种程度上,这些将需要数据中心中的业态或低温冷却系统。随着行业的发展,开源标准将成为解决这个问题的孵化室。

Grossner表示:“这是保证运营商NFV健康发展并未厂商提供新的方式进行交互的重要局侧,这个生态系统尤为重要。”

原文发布于微信公众号 - SDNLAB(SDNLAB)

原文发表时间:2017-06-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏WeTest质量开放平台团队的专栏

鲜科技!内部云游戏沙龙分享

云游戏,也叫订制游戏,是在线游戏的一种不只是网页游戏或者是微端游戏,是一种游戏输入,运算,和画面显示分离的技术。目前有2种主要的云游戏形式:基于视频串流的云游戏...

4017
来自专栏直播吧

微信小程序定制个性化需求开发—呕心沥血谈小程序开发多少钱?uc

小程序开发应用已经越来越贴近我们的生活,小程序的成本是多少呢?我们慢慢的分析一下:

3430
来自专栏ThoughtWorks

一个遗留系统自动化测试的七年之痒|TW洞见

今日洞见 文章作者、图片来自ThoughtWorks:胡志芳。封面图片来自网络。 本文所有内容,包括文字、图片和音视频资料,版权均属ThoughtWorks公司...

3418
来自专栏软件测试经验与教训

面试思路分享

现状:百分之九十的人只能答出等价类和边界值。只有少数人可以讲出其它测试用例设计方法,但深入问,从没有一个人能有令人满意的回答。

1151
来自专栏Java架构

高并发风控技术解密(上)

风控在任何一个公司都是比较神秘的存在,不仅线上很少分享,从安全角度讲也很少对外披露它的架构及设计。本人将就参与的风控建设谈谈风控的技术。(本文来源于本人内部分享...

2616
来自专栏编程坑太多

『高级篇』docker容器来说微服务优势和不足(四)

1773
来自专栏Java架构

高并发风控技术解密(上)

2413
来自专栏TEG云端专业号的专栏

何维兵:大型DCI网络智能运营实践

做运营的同学,都有同样的感受,既希望被老板关注,又不希望被老板关注!因为觉得被老板关注时,常常是没什么好事发生。记得微信红包兴起时,有一次我们网络运营就有幸得到...

3713
来自专栏数据的力量

干货|互联网运营数据分析必须掌握的十个经典方法

3738
来自专栏Alan的UX笔记

交互设计|设计方案记分对比法

1416

扫码关注云+社区

领取腾讯云代金券