前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >峰会回顾 | 光模块:从自采到自研

峰会回顾 | 光模块:从自采到自研

作者头像
鹅厂网事
发布2022-01-04 11:10:06
1.1K0
发布2022-01-04 11:10:06
举报
文章被收录于专栏:鹅厂网事鹅厂网事

前言

11月19日第十一届网络平台部技术峰会在深圳圆满落幕。本次峰会围绕硬件研发、硬件加速、网络产品、网络运营四大领域,深度全面地展示了网络平台部不断精进的研发能力及探索成果。下面让我们共同回顾本次峰会中由硬件研发专家——孙敏博士呈现的《光模块:从自采到自研》的精彩内容。

光模块及应用

光模块首次站在技术大会的舞台,回顾了光模块产品从商用到自采,再到自研的发展历程。着眼未来,我们从“芯”出发,把握关键技术路径,同时探索新型开发模式。

光模块麻雀虽小,五脏俱全,可以说是一套完整的小系统。电信号输入,经过dsp等芯片解析,然后进入驱动芯片,再去带动光芯片进行调制,调制出来的光再进入到光无源系统进行耦合,最后耦合光进入光纤系统传输。

光模块不是数据中心专属的,而是电信网络,特别是长距离传送网络最早开始使用的。但是随着数据中心的发展,包括设备的带宽的提升,光模块开始进入到数据中心应用中。由于数据中心的发展速度远超传统电信行业,所以数据中心对光模块的需求增长也远超传统电信行业。

从商用到自采

对腾讯而言,早期的40G网络实际上是一个封闭的系统,比如说我们买的实际上是传统设备厂商的整个网络系统,包括软件,交换设备和光模块等。商用系统成本高,出了问题不便于运维,这是商用转自采的一个重要原因。

结合25G服务器的上线应用,25G/100G模块开启自采之路,挑战是必然的,第一个挑战其实就是设备之间的适配,光模块单体测试虽然没有问题,但是在自采灰度阶段,我们遇到了很多设备兼容性的问题,我们发现不同厂商的模块在不同设备上每个端口的表现不一样,在不同设备上的表现也不一样,而且为了保证大家都可以传得通,必须得做一个完善的适配方案,形成一套复杂的测试系统,很多时候甚至要一对一针对端口参数进行优化。

但是如果能把自采模块管理的很精细,将会是一个非常有收益的事情。记得在15年到17年之间,我们现网出现大量的40G光模块的故障替换,究其原因,其实是系统集成厂商的光模块都是外购的,对光模块了解较浅,并且对光模块的质量问题如何拦截也基本依靠模块厂商。如果结合自己的实际应用场景,把端到端的模块技术方案进行管理,端到端的流程进行管控和优化,同时把系统的质量管理方案做到位的话,完全可以避免上面出现的这些问题。通过2到3年对自采光模块的不断优化和管控,我们发现不只是成本逐年有收益,而且质量问题得到系统改善,现网故障率不断下降。

从自采到定制

自采光模块的另一个优势是能够满足我们自己网络的多样化发展带来的多样化定制需求,比如业务部门提到10km分光监控场景的需求,需要10km的模块进行互连,因为现成收发一体模块价格高昂,在需求推动下,我们借助现有的模块平台去做一些微小的改进,实现低成本方案。另一个例子是DCI提到了2km的分光的需求,整个项目很有收益,但是技术方案上很有挑战,需要结合我们的现网环境,对现有的模块进行的深度的设计优化,包括规格、模块光学部分及芯片层面的一系列升级优化。

从定制到自研

随着100G服务器的批量上线,200G网络进入量产应用,自研光模块产品的诞生也契合了整个网络从100G升级迭代到200G。光模块行业一个很大特点,就是整个产业链类似于一个“陀螺式”或者“橄榄球形”,中间大,两头小,整个行业号称可以做光模块的公司不下于200家,但是处于产业链最上游的各类芯片厂家可能只有不超过10家,特别像DSP这样技术门槛较高的芯片更是不超过5家,而最下游的应用方或者终端用户的数量也远少于光模块厂商数量,呈现出来产业结构混乱,同时也引申出来一些问题,需求不明确,不具体,芯片价值不清晰。自研光模块的第一个目标就是要打破这个生态,即我们与芯片厂商直接讨论规格需求和成本(用量)需求,从而去实现真正的端到端的成本的竞争力。模式上,我们称之为多方JDM模式,就是我们直接向芯片厂商发出规格需求,以及一些定制化功能,芯片厂商根据我们的需求进行优化或者重新开发,同时模块厂商结合芯片的设计,与腾讯联合设计模块方案,最后由模块厂商负责生产制造。

进入自研阶段,我们要考虑的最重要的问题就是方案的设计和选择如何实现最大价值。“光”跟“电”从传输属性上有着本质的差异,光有它自己的一些特殊属性,比如不同温度下的光功率特性,不同电流下的带宽特性,还有不同条件下的波长特性。在光模块开发过程中,往往会遇到,当想去用一些非常有潜力的电芯片方案的时候,你会发现它不太懂光芯片特性,或者考虑不是那么周全,这种问题如果流入到现网,就会发生类似100G网络时代经常遇到的“链路抖动”。如果普通开发模式,为了满足交付,难以继续开发,但在自研模式下,我们就可以结合系统规格持续去推动方案的不断优化,把电芯片做到更加懂光,从而发挥出更大的技术优势。

光模块大家常常理解为标准品,因为定义好了外壳形态,输入输出接口规格,但内部的光学封装是一个特殊的东西,封装方式五花八门,每一个厂商的设计都不一样,涉及到的制造设备也是定制化的,如果我们要快速设计及制造一个自研模块,我们就要面临平台选择的问题。自研光模块模式下,充分利用已经成熟的100G模块的封装平台,同时针对性的做一些升级改造,是满足质量稳定性,开发效率以及低成本等诉求的最好解决方案。

对下一阶段的探索

我们的网络基本上是2到3年迭代一次,从交换芯片的路标来看,全面112G网络将在2023年来临。近期大家已经在讨论下一代基于112Gbpsl的网络开发的事情,包括网卡和交换设备。

在模块层面,前面2年我们也陆陆续续做了一些技术摸底,从100G到400G&800G,模块功耗肯定会持续提升,同时,BER就是我们说的误码率,也会面临指数级的劣化。这些需要加大在芯片层面的设计和优化工作,甚至包括参与芯片的设计。光学封装方面也会面临一系列的挑战,需要探寻各种新的提高光学集成度的方案,在传输方案上,我们也需要持续挖掘以满足腾讯的网络场景需求。

信号传输距离是互联硬件的一个基本属性,也是我们每次探讨未来技术方案和发展趋势的时候,必须要讨论的关键约束条件。随着基础速率的不断提升,我们的数据中心机房或者IDC在物理距离上基本不太会有大变化。因此,在做连接两台设备之间的模块或者技术方案的选择的时候,需要随着传输技术的迭代而发生迭代的。“距离”的演进上有三个界面,从短距离接入侧来看,是“光”进“铜”退,从IDC机房内部连接来看,是单模替代多模,从DCI连接来看,是相干技术的不断下沉。以上这些方面,我们也陆续做了一些提前布局,包括在112Gbpsl网卡接入这一块,我们正在布局基于112Gbpsl TAC技术以及相应的芯片合作开发。IDC机房内部的连接方面, MM SR模块可能无法满足我们数据中心机房 (Building Range)内部的连接,特别是跨房间的连接,这里,我们也在探索单模替代多模的方案,特别是在单模全集成芯片方案上也做了一些联合开发的尝试。IMDD和coherent的选择和替代,我们预计可能会在1.6T或者单波400G这一代到来,所以未来我们会在Coherent-lite这个领域,特别是oDSP算法上做一些工作。

从“芯”出发

400G+上我们还会探索一些新的模式,其实有一些我们已经在布局,包括建立芯片实验室及芯片级系统验证平台,以及牵引一些行业的标准等。

光模块跟传统电气器件/设备的一个关键的区别,就是它不仅要有“电”的特性,还要有“光”的特性,所以它必须同时面对微电子的摩尔定律和光电子的摩尔定律。随着光进铜退的趋势,全球都在不断整合核心的光电资源,以传统电芯片领域的巨头为首的厂商,他们也在往光电子这个领域不断的去扩张,为未来的光电融合趋势做准备。同样,我们也需要做些什么,去迎接一个又一个挑战。112Gbpsl可能是一个很长的过程,基于112G Serdes的400G+系统,正是我们需要在当下布局, 展望未来的最好契机!

欢迎关注公众帐号“鹅厂网事”,我们给你提供最新的行业动态信息、腾讯网络最接地气的干货分享。

注1:凡注明来自“鹅厂网事”的文字和图片等作品,版权均属于“深圳市腾讯计算机系统有限公司”所有,未经官方授权,不得使用,如有违反,一经查实,将保留追究权利;

注2:本文图片部分来自互联网,如涉及相关版权问题,请联系sandyshuang@tencent.com

/

/

鹅厂网事/

分享鹅厂网络的那些事

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-12-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 鹅厂网事 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档