专栏首页摸鱼范式从DPU的崛起谈谈计算体系变革(二)

从DPU的崛起谈谈计算体系变革(二)

DPU/IPU的重要性已经达成了共识。但围绕DPU的定位存在一些争论,不同的公司根据自己技术特点选择不同技术路线。首先我们回顾一下数据中心的问题和技术发展的趋势需求:

3.1 数据中心有什么问题?

数据中心作为当前信息化的基石,在过去50年发展相当迅猛。随着算力的提升,数据中心的能耗也越来越大,通常从广义上讲,数据中心面对三个核心问题:

  • 性能问题(scale-up):如何提升计算性能,简单说就是单台服务器越算越快,这个有点难度,目前性能最强大的CPU应该是ARM架构的富岳(Fugaku);
  • 规模问题(scale-out):第二个问题就是系统效率问题,如果一台服务器算力不够(大部分数据中心应用一台服务器是不够的),那么我们就需要多台服务器组成集群进行集群计算。如何接入更加多的服务器?并高效率的统筹各个服务器的运行状态和效率也是一个非常复杂和需要解决的问题,通常这个问题是一个系统架构和网络问题;
  • 能耗问题(power):第三个问题是能耗问题。如何降低能耗、提升计算效率,从传统追求性能的技术路线,变成追求效能的技术路线?中国在这一方面战略上远远领先其他国家,特别是“碳达峰、碳中和3060”基本方针的提出。如果中国能早日实现计算上的“碳中和”,让CPU可以仅仅消耗极小的能耗即可运转的话,对能源安全和信息格局将发生巨大影响。

性能和能耗问题是一个非常复杂又有趣的问题,但不是我们DPU的重点,未来我们将介绍一篇如何用DPU和低功耗CPU也可以达到高性能高吞吐量计算的架构,今天我们接着DPU的技术路线继续。

按照DPU开始的定义,DPU核心是解决数据中心第二问题:“如何解决多节点服务器互联效率问题”。按照Fungible的结论,当前数据中心互联架构无法适应超大型数据中心(mega datacenter)和超小型数据中心(edge datacenter),所以Fungible提出用DPU和TrueFabric技术解决这个问题。 的确有些数据中心非常大,几万台甚至十几万台服务器互联组成集群;有些特别小,可能只有十几台服务器互联。那么Fungible这种技术路线是不是可以解决这个问题呢?有没有更加友好的技术路线呢?

3.2 数据中互联面临的题?

数据中心互联通常采用光通信方式,随着容量的提升在100T当量下,光模块的功耗占比超过了互联整体成本的50%,并且光模块成本也已经超过了通道成本(也就是说光模块加起来比交换机盒子贵了),但是随着吞吐率的激增,互联延迟缺没有明显降低。

来源:互联技术工作小组

3.3 云计算产业下游的需求是什么?

那一方面数据中心的用户,下游云计算产业的需求是对设备越来越颗粒化的管理和资源调配。在云计算3.0架构下,云管理平台(IaaS)希望对设备(CPU、GPU、FPGA、AI、NIC等)继续更加细致的管理,最好可以对每个设备进行独立操作(远程替换、升级、资源分配)。当然这种管理最好基于TCP/IP协议的Restful API接口。如果进一步,希望每个微服务(CPU运行应用)之间的TCP/IP通讯也可以在新型网络架构中加速。

云计算2.0以服务器为单元,实现计算资源的软件定义,IaaS软件通过对服务器CPU的控制,实现CPU、内存、储存、网络的资源分配。而云计算3.0时代,设备单元将以“个体”、“独立”的方式被云平台(IaaS)管理和控制,整个设备单元以机柜(rackscale disaggregated hardware)方式存在。同时一切以API调用为主!

3.4 边缘智芯总结DPU需要解决的问题?

在Fungible的基础上,我们总结了数据中心互联DPU芯片需要解决的几大问题如下:

分类

内容

节点间

提升以太网通讯效率,降低TCP/IP时延

提升以太网通讯稳定性

节点内

总线级别扩展,灵活配置管理各种计算设备,支持IaaS管理

增强节点内数据处理效率

功耗

降低流量处理功耗

成本

降低流量处理成本

市场

适合边缘计算、数据中心市场,适应云计算3.0应用场景

下一篇我们将介绍当前DPU解决方案针对上述七个问题的特色和优缺点 ...

本文分享自微信公众号 - 摸鱼范式(icparadigm)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-08-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 全网首发 | 马斯克的挑战(下)

    这几天,我们在以全网最完整的编译、全网最迅速的动作,来为读者带来科技人气王Tim Urban的Neuralink长文。 我们用第一篇仔细剖析了神经网络的进化史...

    AI科技大本营
  • 技术向:云网融合的探索

    本文主要是关于如何设计一个Cloud-Scale的操作系统和通过一系列紧耦合优化运营成本。

    SDNLAB
  • 处理器“三国鼎立”:从CPU、GPU到DPU

    当2020年10月份,NVIDIA在其GTC 2020大会上大张旗鼓的宣传DPU之后,整个行业热了起来,大家都在问:什么是DPU?DPU到底能干什么?DPU和G...

    SDNLAB
  • [书籍福利]大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活

    Rookie
  • 从SmartNIC到DPU,智能网卡的演进之路

    2021年9月25日,由“科创中国”未来网络专业科技服务团指导,江苏省未来网络创新研究院、网络通信与安全紫金山实验室联合主办、SDNLAB承办的“2021中国智...

    SDNLAB
  • 【深度】马斯克与特斯拉成自动驾驶代名词,40%的人却为此愤怒

    【新智元导读】特斯拉公司的故事是美国商业史上最有趣而且史无前例的公司故事之一。本文是关于马斯克与特斯拉的长篇特写。特斯拉已经成为自动驾驶汽车的代名词,这也让它在...

    新智元
  • 智能网卡的智障需求

    很多事情,我们想不明白只是因为没有从根源上去分析,那么我们来从智障网卡说起,来谈谈智能网卡的最小需求.

    SDNLAB
  • 算力经济下DPU芯片的发展机遇

    当前承载算力的基础设施是各种规模的的数据中心,从几十个服务器节点的小规模企业级计算中心到数万个节点的巨型数据中心,通过云计算的模式对应用层客户提供存储、软件、计...

    FPGA技术江湖
  • 《2020财务从业者生存现状报告》发布,解密你不知道的财务人崩溃时刻|腾讯SaaS加速器·学员动态

    ? 来源 |  腾讯SaaS加速器首期项目-分贝通 ---- 腾讯SaaS加速器 二期30席项目招募 报名方式 腾讯SaaS加速器,作为腾讯产业加速器的一个重...

    腾讯SaaS加速器
  • Fungible DPU:一种新的处理器类型

    编者按:Fungible和NVIDIA都发布了DPU——一种新的处理器类型,DPU到底是什么?它有哪些功能?价值是什么?目前其实各家的看法都还不太一样。兼听则明...

    SDNLAB
  • 三大门户二十年,中国互联网踏上新征程

    12月1日,是新浪20岁生日,新浪众多官方账号在微博发起了#新浪20周年#的转发抽奖活动,随机抽取网友,每人1万元感恩现金。12月2日,新浪董事长兼CEO、微博...

    罗超频道
  • 北大 AI 公开课第2讲实录-雷鸣&余凯漫谈嵌入式AI(超级完整版)

    【新智元导读】“北大 AI 公开课”系统第二讲《嵌入式人工智能:从边缘开始的革命》于周二晚上结束,北大人工智能创新中心主任,百度创始七剑客之一雷鸣和前 IDL ...

    新智元
  • 业界|英特尔买下了 Nervana,然而 DPU 的魔力何在?

    导读:在过去的一个月中,Intel收购了深度学习芯片公司 Nervana Systems ,以及移动和嵌入式机器学习公司 Movidius,给未来的深度学习下了...

    AI科技评论
  • 在大数据时代存储是基石,看大佬们在2017中国存储峰会上都说了啥?

    12月5日,由DOIT传媒、存储在线和中国计算机学会存储专委会联合主办的2017中国存储峰会在北京盛大开幕。本届峰会以“数据中流击水,浪遏飞舟”为主题,吸引来自...

    数据猿
  • 张笑容:互联网+共享经济

    7月14日晚,腾讯研究院与TechWeb联合主办的第13期“互联网前沿沙龙”如期举行,本期主题为“共享经济:下一个大趋势”。连尚网络(wifi万能钥匙)联...

    腾讯研究院
  • PPT有误不影响内容,陆奇早已预见AI潮流和趋势

    AI科技评论按:6月8日,百度集团总裁兼COO陆奇出现在爱奇艺世界•大会上,这是也陆奇首次在百度系列活动上公开亮相,让人意想不到的是,演讲内容没有火,却因为PP...

    AI科技评论
  • “中国智造”将“消灭淘宝”,马云慌吗?

    镁客网
  • 扒一扒「清华系」的 AI 安防大佬们

    1978年,文革刚刚结束,改革开放正在酝酿,清华大学便在计算机系内部成立“人工智能与智能控制”教研组。

    AI掘金志
  • SHAREit CTO陈少为:如何以技术驱动市场规模的快速扩张

    一入技术门,终生技术人。技术出身的人员专业性和专注度毋庸置疑,但似乎并不太灵的市场嗅觉让很多创业的技术团队都未能获得成功。但技术出身的团队,真的就无法帮助企业快...

    养码场

扫码关注云+社区

领取腾讯云代金券