城域网100G 光传输系统实现客户接入链路告警

100G 波分传输系统的实现客户接入链路告警

新普矽谷科(北京)有限公司

摘要:为了确保一种小型化、低成本100G传输系统的可靠运行,提出了一种方案实现传输系统中的故障诊断和告警信息传递,分析了告警信息传递的关键技术和实现流程,并通过测试验证了告警信息传递的性能。

关键词:100G波分复用传输系统,链路告警传递,FPGA

随着云计算,移动4G/5G互联网,社交网站,电子商务和各种各样视频业务的兴起,网络容量需求剧增,传统的10G网络面临巨大挑战。近年来,拥有100GbE或100G光传送网(OTN)端口的交换机和路由器逐步进入大型数据中心,这使得作为支撑的光传输网也进入了100G时代。另一方面,光网络变得越来越复杂,光网络管理也越来越有必要。网络管理系统的存在对保证网络高效、安全和持续运转是必不可少的,网络管理的实施应能处理网络中的配置、故障、性能和安全等问题。

客户侧与线路侧告警信息处理过程,如下图:

通过网管进行端口配置

客户侧链路告警信息处理过程主要步骤如下:

① 客户侧CFP模块接收链路发生故障。

② CFP模块控制链路信息管脚直接与FPGA相连,一旦发生链路故障,CFP模块会立即产生一个告警信号。FPGA实时监控CFP管脚状态,一旦发现告警信息向两个方向传递,通过上游传递给本地设备,本地设备关闭CFP模块的发送光功率接口以阻止垃圾信息产生,这称为Tx-sync本地设备客户侧接入链路故障处理过程。同事,FPGA会把告警信息插入OTN帧开销中,通过线路侧SFP+模块传递到远端设备,一旦远端设备检测到告警信息,远端设备会关闭CFP模块的发送光功率接口,从而阻止设备向100G交换机或路由器发送垃圾信息,这称为远端设备客户侧接入告警信息处理过程。

③ 在链路恢复正常的过程中,链路信号的处理过程为:FPGA实时监控CFP管脚状态,一旦链路告警信号消失,链路回复信号也会同时向上游和下游进行传递,一方面本地设备检测到恢复信号会使得CFP工作正常,继续向交换机或者路由器发送信息;另一方面,远端设备通过检测OTN帧开销收到链恢复信息,远端设备CFP工作恢复正常。

线路侧链路告警信息处理过程主要步骤如下:

① 线路侧SFP+模块接收链路发生故障。

② SFP+模块的控制链路信息管脚直接与FPGA相连,一旦发生链路故障,SFP+模块会立即产生一个告警信号,FPGA实时监控SFP+管脚状态,一旦发现告警信息会把告警信号向两个方向传递,通过上游传递给远端设备,FPGA会把告警信息插入到OTN帧开销中,通过链路侧SFP+模块传递到远端设备。一旦远端设备检测到告警信号,远端设备会关闭CFP模块的发送光功率接口,从而阻止设备向100G交换机或者路由器发送垃圾信息,这称为Tx-sync远端设备线路侧接入告警信息处理过程。同时,FPGA向下游传递告警信息给本地设备,本地设备会关闭CFP模块的发送光功率接口以阻止垃圾信息产品,这称为本地设备线路侧接入链路故障处理过程。

③ 在链路回复正常的过程中,链路信号的处理过程为FPGA实时监控SFP+管脚状态,一旦链路告警信号消失,链路恢复信号也会同时向上游和下游传递,一方面本地设备检测到恢复信号会使CFP正常工作,继续向交换机或路由器发送信息;另一方面,远端设备通过检测OTN帧开销收到链路恢复信息,则远端设备CFP恢复正常工作。

Dying Gasp掉电告警过程处理主要步骤如下:

① 本地设备突发掉电故障

② 电源模块控制电源信息管脚直接与FPGA相连,若发生Dying Gasp故障,电源模块会立即产生一个告警信号,FPGA实时监控电源状态,一旦发现告警信息,FPGA即刻把告警信息插入到OTN帧开销中,通过线路侧SFP+模块传递到远端设备,远端设备检测到电源告警信息后,立刻切断电源或进行其他操作。

③ 电源恢复正常的过程为:FPGA实时监控电源管脚状态,一旦电源告警信号消失,链路恢复信号通过express channel快速传递到远端设备,远端设备通过检测OTN帧开销收到电源恢复信息,远端设备恢复正常工作。

测试结果与分析

为了验证告警传递性能,本文按照上文提及的测试环境进行了功能测试。通过拔出客户侧接入光纤产生告警故障,检查客户侧光模块的接收光功率来判断告警传递是否实现,具体测试结果如下表格:

表1设备A光模块接收光功率值

表2设备B光模块接收光功率值

其中LH1/1/1表示线路侧总接口,100G信号分成10路10G信号进行处理,lane1-lane2代表10个10G光模块。SH1/1/1指客户侧光模块接口,因为客户侧只有一个光模块CFP,但100G客户信号由4路光纤(每路25Gb/s)组成,所以分成lane1-lane4这四个通道。表1中,当客户侧光模块出现接收故障时,对应接收光功率为-50dBm,为了阻止客户侧向交换机/路由器发送垃圾信息,本地设备A客户侧关闭发送光功率接口,表现为设备A客户侧发送光功率为-50.0dBm.表2中,本地设备A把告警信息传递到远端设备B,在接收到告警信息后,远端设备关闭客户侧发送光功率接口用于组织垃圾信息产品,表现为设备B客户侧发送光功率为-50.0dBm。

参考文献

【1】贾真真,何文,史朝翔,常建新,高猛,《一种低成本100G传输系统的链路告警传递》

l

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

2 条评论
登录 后参与评论

相关文章

来自专栏吴生的专栏

消息中间件选型分析——从Kafka与RabbitMQ的对比来看全局

消息队列中间件(简称消息中间件)是指利用高效可靠的消息传递机制进行与平台无关的数据交流,并基于数据通信来进行分布式系统的集成。通过提供消息传递和消息排队模型,它...

4317
来自专栏程序猿DD

主流Java数据库连接池比较及前瞻

常用的主流开源数据库连接池有C3P0、DBCP、Tomcat Jdbc Pool、BoneCP、Druid等

1625
来自专栏编程一生

服务设计要解决的问题

  “业务的服务(相对于我们基础架构这边的底层技术)在技术上就需要解决三个问题:分布式、通信和存储。”

721
来自专栏Java技术

Redis 深度历险:核心原理与应用实践!

Redis 是如今互联网技术架构中,使用最广泛的缓存。支持复杂的数据结构,支持持久化,支持主从集群,支持高可用,支持较大的value存储...

1611
来自专栏存储

分布式架构—基本思想汇总

往期精选 在互联网大行其道的今天,各种分布式系统已经司空见惯。搜索引擎、电商网站、微博、微信、O2O平台。。凡是涉及到大规模用户、高并发访问的,无一不是分布式。...

19810
来自专栏CSDN技术头条

【问底】徐汉彬:大规模网站架构的缓存机制和几何分形学

【导读】徐汉彬曾在阿里巴巴和腾讯从事4年多的技术研发工作,负责过日请求量过亿的Web系统升级与重构,目前在小满科技创业,从事SaaS服务技术建设。 在过去的工...

19110
来自专栏养码场

一周播报| 平淡无奇,但暗藏杀机的一周

养码人B:消息写DB的话,TPS、RT 这些能接受吗?你们用的是什么消息中间件?

331
来自专栏CSDN技术头条

荔枝FM架构师刘耀华:异地多活IDC机房架构

声明:本文首发于CSDN,禁止未经许可的任何形式转载,可咨询文末的责编。 多机房架构存在的原因 ? 单机房一旦死机,断电、维护根本无法挽回整个数据,想离线读取等...

2746
来自专栏腾讯技术工程官方号的专栏

【TEGer 在全球架构师峰会】 : 腾讯企业级消息中间件 CMQ 技术解密

本文将对腾讯 TEG 基础架构部中间件团队研发的企业级消息中间件 CMQ 原理进行分享介绍。

3249
来自专栏芋道源码1024

Redis 深度历险:核心原理与应用实践

Redis 是如今互联网技术架构中,使用最广泛的缓存。支持复杂的数据结构,支持持久化,支持主从集群,支持高可用,支持较大的value存储...

1232

扫码关注云+社区