首页
学习
活动
专区
圈层
工具
发布

OCS 四大技术缺陷!

分享一篇早期关于OCS的文章。 谷歌在2022年引入了光交换机以替代主干层电交换机,强调了OCS的几大优势,如数据速率和波长无关、低延迟和高效节能等等。...由于OCS具备全带宽处理能力,当谷歌将leaf switch升级至1.6T/3.2T光模块时,现有OCS设备无需更换,这种可持续使用特性有效抵消了初期投资。...若按谷歌规划的3代设备升级周期计算,OCS单代前期成本约为EPS的3.5倍(考虑到每代EPS的平均售价持续上涨)。若OCS能支持4代设备升级,则两者的资本性支出差异可能高达六倍!...另外,传统OCS在进行光路切换时耗时较长。打个比方,OCS 就像一个铁路道岔。它们可以有多条路径,但火车一次只能穿过一条特定的轨道/路径。为了改变火车的行驶路径,必须手动重定向轨道。...硬件标准化:设计兼容性更强的硬件接口,使新设备能够自动识别和集成。 2. 软件定义网络(SDN):利用SDN技术动态配置网络资源,减少人工干预。 图-配图仅供参考 3.

76201

UCB的硅光MEMS OCS控制技术

光交换(OCS)类似传统电话交换机,只不过它传输的是光信号。与EPS相比,OCS的直接光连接能降低功率损耗和延迟,但需要提前规划连接路径,适用于流量较为稳定、可预测的场景。...这一实践展示了OCS在大规模数据中心中的可行性和优势,也引发了业界对OCS技术的更多关注。...(三)OCS技术的发展方向 未来,分布式AI/ML工作负载对网络性能提出了更高要求,需要更频繁的拓扑优化。然而,目前OCS的ms级切换速度仍限制了其在这方面的应用。...因此,开发更快切换速度的OCS技术成为了未来的重要研究方向。 (四)现有OCS技术的优劣势 目前的OCS技术主要包括3D MEMS镜子技术、压电式开关、硅光OCS等。...硅光OCS虽然切换速度快且成本潜力低,但存在插入损耗和串扰等问题。基于InP的OCS虽有无损切换的优势,但工艺不成熟、成本高、规模做不大。

1.8K12
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Drut Technologies:CPO+OCS打破静态机架算力局限

    Drut Technologies成立于2018年,总部位于美国新罕布什尔州纳舒厄,业务覆盖美国、印度及欧洲市场,是OCS光子解聚合技术领域的先驱企业之一。...而实现服务器解耦的关键,在于低延迟、高带宽的动态互连技术——这正是Drut 2500系列光子架构与光交换(OCS)的核心应用场景。...◆ OCS与CPO技术:实现低延迟光子互连的关键 Drut报告强调,“PCIe remoting over Optical Circuit Switch(OCS)”是服务器解耦的技术核心——...即通过OCS(光电路交换机)构建动态光子fabric,实现PCIe信号的长距离、低延迟传输;而CPO技术则是提升光子互连密度、降低功耗的关键突破。...OCS的作用:动态光路由 Drut的光子fabric基于OCS实现“动态互连”:OCS作为Layer-1层交换机,可实时调整iFIC 2500与tFIC 2500之间的光子通路,无需依赖传统以太网或

    37411

    OFC 2025 Google报告: OCS技术使能AI集群的高效扩展,显著提升系统可用性和能效

    引言 TPU 发展历程: 2013 年,Google 启动 TPU(张量处理单元)项目,首代 TPU v1 通过 PCIe 接口实现每秒千次推理,推动语音识别、图像搜索等 AI 应用落地。...OCS 技术细节与优势 架构设计: 3D Torus 模块:每个机架内的 4x4x4 Torus 模块通过 OCS 连接,形成 16x16x16 的逻辑架构,支持灵活任务分割(如 8x8x4 或 16x8x16...OCS 在 AI 集群中的应用 模型训练案例: Palm 模型训练6 个Super Pod动态分配资源,50天内通过 OCS 调整拓扑,应对节点故障和维护,确保训练连续性。...带宽优化:通过 OCS 动态分配,消除跨机架流量瓶颈,降低延迟。 4. 未来展望与行业影响 行业趋势: 超大规模数据中心需求推动 OCS 技术主流化,解决铜缆连接的能效和扩展性瓶颈。...OCS 的动态拓扑调整、WDM 复用和环形器设计,使其成为大规模 AI 训练的关键技术。未来,随着超大规模数据中心的发展,OCS 技术将在行业中发挥更重要作用,推动 AI 基础设施的革新。

    2.7K13

    港科大MixNet入选SIGCOMM 2025:区域重构OCS光交换让MoE训练成本效率显著提升1.2-2.3倍

    基于此,MixNet提出“区域可重构OCS+静态EPS”的混合架构,在无需全局重构的情况下适配动态流量。...域:每个区域连接80-250台服务器(基于毫秒级OCS的端口限制),专门承载EP的动态区域通信,通过实时重构适配流量热点,单个OCS单元支持576×576端口规模; - 全局静态EPS域:基于以太网/...2.2 区域OCS的部署智慧 - 部署位置:区域OCS连接一组GPU服务器,每台服务器将部分网络接口卡(NIC)分配给OCS(其余保留给EPS),例如每台服务器配置4张NIC时,2张接入OCS、2张接入...识别瓶颈链路:计算当前通信矩阵中各GPU对的传输时间(数据量/链路带宽),排序找出最长时间的瓶颈链路; 2....优先分配电路:为瓶颈链路分配OCS电路,直至端口资源用尽,单区域OCS最多可同时支持288条高带宽电路; 3.

    81521

    IT 资产管理系统 OCSInventory-NG 认知

    OCS Inventory NG 的主要功能包括: 资产发现和清单收集:OCS Inventory NG 可以自动发现网络中的计算机和设备,并收集它们的硬件和软件配置信息。...软件许可证管理:OCS Inventory NG 可以跟踪和管理组织中安装的软件许可证。它可以帮助管理员识别未经授权的软件安装,并提供有关已安装软件的许可证信息。...OCS Inventory NG(Network Inventory)是由多个组件组成的网络资产清单管理系统。...它负责收集计算机的硬件和软件配置信息,并将其发送到 OCS Inventory NG 服务器。...OCS Inventory NG Server(服务端) :Server 是 OCS Inventory NG 的核心组件,负责接收和存储来自客户端的资产信息。

    1.3K10

    SC 25:哥伦比亚大学与 NVIDIA 联合提出 ACTINA框架,优化 OCS AI 网络性能与能效

    OCS技术的出现打破了这一僵局。与静态网络不同,OCS可动态重构链路、按需分配带宽,且硬件成本低、功耗低,已在大规模生产数据中心和ML集群中部署。...由于AI工作负载的通信模式具有确定性,可通过分析通信子图的流量大小、目标节点,精准识别最优重配置时机。...Giant OCS抽象与逻辑拓扑 为简化网络建模,ACTINA提出Giant OCS抽象:所有GPU通过可转向光链路直接连接到一个大端口无阻塞OCS,可任意分配链路资源,模拟任意拓扑。...在较低的 OCS 功耗下,OCSBCube 和 TPUPod 的总功耗相似,但随着 OCS 功耗增加,OCSBCube 的功耗超过 TPUPod,因为其 OCS 组件数量更多。...此外,可以注意到,在较低的 OCS 功耗下,收发器功耗是 OCSBCube 和 TPUPod 的主要贡献者;而当 OCS 功耗增加到 3.8 W(Tunable laser方案)时,OCS 功耗成为主要贡献者

    30011

    SK hynix:基于对象的计算型存储分析系统

    OCS:在OCS架构中,查询以SQL的形式直接发送到OCS系统。OCS能够在存储层筛选出相关数据,将符合条件的数据直接返回给客户端。这样避免了读取不必要的数据,减少了数据移动量,提高了查询效率。...OCS 系统架构 • OCS系统由OCS前端服务器和基于对象的计算存储阵列(OCSA)组成 通过NVMe over Fabrics将后端存储(OCSA)解耦 • OCS是一个垂直优化的分布式分析系统 支持基于标准的对象和查询下推接口...计算与存储的整合 - OCS:OCS不仅是一个存储系统,还在存储层加入了计算能力,可以在数据存储的同时进行数据过滤、查询下推等计算操作。...支持多种异构设备 - OCS:OCS架构中的OCSA设备支持异构硬件(如NVMe SSD、CSD、CXL内存等),并通过异构设备管理来高效利用这些硬件资源。...OCS系统具有高互操作性和灵活性,并且可以节省主机资源。 5. 实验结果表明,使用OCS系统可以显著提高数据分析性能,同时减少数据传输和计算网络开销。

    54510

    OCP EMEA 2025:Oriole介绍光子网络(OCS)赋能AI的挑战、机遇和演进

    的应用与挑战,以为未来OCS如何做到取代EPS的一些观点。...三、光交换(OCS)的实践困境与突破方向 1. 谷歌的先驱实践:从数据中心核心到推理集群扩展 OCS技术在AI网络中有着重要的应用实践。...因此,OCS技术仅适用于连接持续时间较长的场景,以保证足够的吞吐量,这在很大程度上限制了其应用范围。 为突破这一困境,研究人员致力于将OCS的重新配置速度提升至微秒甚至纳秒级别。...性能对比:OCS vs 电分组交换(EPS) OCS技术面临的另一大挑战是,在集体数据传输过程中,若数据传输时间远短于交换机的重新配置时间、网络控制重新配置时间以及收发器的启动时间,OCS系统的性能将不如快速电分组交换系统...这就引出了一个关键问题:基于OCS的网络能否展现出与传统电分组交换(EPS)系统相媲美的性能? 构建一个能够替代EPS系统的OCS网络,需要解决诸多技术难题。

    97101

    Forefront For Office

    一、创建用户并设置用户 首先我们在域控制器上创建一个用户,这个用户用来启动OCS服务和传达Forefront For OCS服务器的即时消息给各OCS客户端。...三、测试Forefront For OCS 我们打开Forefront For OCS控制台看看是什么样子。桌面清晰,一目了然。...我们在域控制器上用管理员的身份登陆OCS客户端,在OCS服务器上用zhangsan的身份登陆OCS客户端,如下图登陆成功后,我们让管理员给zhangsan发一个病毒文件,来测测试一下Forefront...接下来我们打开Forefront For OCS控制台中设置一下,来阻止OCS客户端来互相传送RAR压缩文件,打开Forefront For OCS服务器,选择“筛选”中的“文件”------“添加”-...发送了一个OCS2007安装包,已经发送了一多半了。 ? 马上就快发送完成了,出现了下面的提示“无法将OCS2007标准版.rar”发送给管理员 ?

    83610

    Google TPU架构揭秘:OCS光交换,从4x4x4 Cube到9216卡Ironwood的进化引擎

    数量为:6144 Links ÷ 128 Ports/OCS = 48 台 OCS。...为了在物理层严格控制和适配3D Torus,48台OCS被严格化为为三个正交组分别承载X/Y/Z轴不同维度的流量,以X轴组为例,包含16台OCS,遵循“同维互联”原则,每一台OCS仅仅负责连接和承载所有...OCS不读取数据包头、不进行光电转化,仅仅只是物理层面的“光线反射镜”,在Palomar OCS机箱内部光信号的传输路径呈现出一个经典的“W”形状,最大限度减少插入损耗和实现任意端口间的互联。...那么需要多少OCS呢?...320*320规格的OCS),同时将 OCS 与 Cubes 之间的Twisted 3D Torus连接带宽提升至 800G/1.6T,确保了超大规模集群下的无阻塞通信。

    1.4K11

    Nvidia探索光交换OCS在数据中心及高性能计算集群中的应用

    然而,高速光交换面临硬件成熟度低、系统时钟同步复杂等挑战,尽管如此,谷歌近期工作推动了OCS在数据中心的部署,最新研究也聚焦于OCS在机器学习应用系统中的使用,如TPU V4的相关研究展示了新的架构优化...◆ OCS集成的位置与功能 在通用三级胖树拓扑中,OCS有多种集成点,如在叶层和脊层间添加OCS层(脊OCS层)可保持胖树拓扑并实现隔离、冗余和拓扑调整;用OCS替换核心和脊交换机(OCS...本研究利用L1可编程数据平面和OCS,通过在交换层间添加OCS及冗余交换机,动态重配置网络实现高效自动故障恢复。...使用Polatis的320端口商用OCS用于服务器到叶交换机和叶交换机到脊交换机的连接,该OCS由定制的L1控制平面软件控制,用于物理层资源管理。...◆ 发展方向 需提升光收发器与OCS兼容性,降低OCS成本(遵循成本降低曲线,集成光技术有望带来更大成本收益),提高可靠性(优化各构建模块,考虑芯片增益和放大器设计,改进系统设计),以加速OCS

    1.8K11

    Google OCS光路解耦揭秘:寒武纪大爆发,从供应链双轨到CPO百万卡全光计算织物

    AGI小咖 本文基于 Google 十年来的 OCS 研发与部署经验,从 TPUv4 的 48 台 OCS 原型验证,到 TPUv7 Ironwood 的 14 万卡级 Jupiter 网络大规模商用,...1、Google OCS光路解耦演进 世界上唯一大规模商业化应用OCS的估计只有Google,从早期的Apollo 项目探索到Ironwood 架构落地,从 TPUv4 的 3D Torus 拓扑到 Jupiter...DCN网络中 Spine 层的全面光化,从48台OCS组建3D Torus的4096颗TPUv4 Pod到1024台OCS支撑起147,456 颗 TPU v7 Pod的超大规模互联网络,OCS成为了...1.1 ICI 网络革命:从 48 台 OCS 构建 TPUv4 Pod 到 3D Torus 范式 在 ICI 专用网络层面,OCS 的引入彻底改变了超算集群的拓扑构建方式 , Google在NSDI...1.3 Jupiter DCN 范式转移:OCS 重构骨干网迈向 14 万卡集群 如果说 ICI 网络是 OCS 在专用超算领域的胜利,那么 Jupiter DCN 的演进则标志着 OCS 在通用数据中心骨干网层面的全面突围

    82610
    领券