基于无尺度网络模型的启发——一种新型数据中心架构的设想

无尺度网络(Scale Free Network),在网络理论中指的是一类有特定特征的网络。无尺度网络所具有的特征是:大部分节点只有极少的边连接,只有极小一部分节点有大量的边连接。这一小部分有着大量连接的节点在无尺度网络模型中被称为“关键节点”,关键节点承担整个网络的连通性,如果把整个网络的连通性作为评价标准,并且给每个节点都赋予一个权值用来衡量改节点为网络连通性所做的贡献,那么关键节点与普通节点的权值比一定十分大。由此我们得出,在无尺度网络中,失去一个乃至若干个普通节点,对网络的影响是极小的,而失去一个权值极大的关键节点或可对网络造成巨大影响。可以发现,无尺度网络所描述的模型和二八理论非常契合,20%的网络节点是极度重要的,因为他们支撑起了网络的骨架。从这个角度看,80%的网络节点显得并不那么重要。

进入21世纪之后,因特网蓬勃发展,因特网上所承载的信息以指数式的暴涨,承载这些信息的网页,也在短时间内迅速增长,资料显示网页以每年20%-30%的速率增长,直到2015年中国网页的数量已经突破了2000亿。许多网页之间是通过超链接形式相互跳转的,无尺度网络模型的研究人员对迅速增长的网页产生了兴趣,他们认为网页的增长,必然带来链接数的增长。他们抽取了一部分网页进行了研究,网页以及它们的超链接所组成的抽象网络呈现出无尺度网络模型的特征,及在一小部分网页,如某个门户网站的首页存在着极大量的超链接,而在大部分网页,称为终端网页,它们所拥有的超链接只有一小部分。这个发现让人们试图将无尺度网络模型引入当今的互联网体系研究当中。图1为无尺度网络模型示意图。

图一

既然网页群可以适用无尺度网络模型,那么对于互联网物理层的这些路由器、交换机以及数据中心,能否适应无尺度网络模型呢?很明显,以上这些网络的硬件设备承载着整个网络的信息传递,如果把交换机、路由器、数据中心都抽象为网络模型的节点,我们可以发现,大部分的路由器和交换机都只存在少数的网络连接,而一个数据中心因为它所承担的职能,往往拥有大量的网络拓扑连接,它与路由器交换机相比简直就是一个信息集散地。应用无尺度网络模型理论来描述这个抽象网络,数据中心就是拥有极大权值的“关键节点”,路由器、交换机则为普通节点。我们可以设想,某个网络拓扑中的某个路由器坏了,在没有及时处理的情况下,整个网络的信息流不会有太大影响,因为本来应该通过这个路由的信息或许可以绕路同样可以到达目的地。但是如果网络拓扑中的数据中心故障,你可以想象的是,由于数据中心拥有大量的连接,这种故障会造成大量连接失效,必然导致网络信息流大量停滞。

在无尺度网络理论中,对网络的描述是:有很强的鲁棒性,但是面对协同攻击时极其脆弱,同时,理论也给出如何克服关键节点的弱点,即把连接适当的分散化,降低关键节点的集散性。但是同时又不能过度分散,这样会使“关键节点”的优点弱化。如何才能既增加其抗协同攻击的能力,又不过度减少其鲁棒性。这个问题的解决方案即可为数据中心的架构提供参考方案。

笔者提出一种参考方案,即“蜂窝式的离散数据中心架构”,将传统的一个数据中心离散化,但离散的程度并不足以打消节点的鲁棒性,又能够大大加强其应对协同攻击的能力,称其为“亚离散化”。参考架构如图2所示:红色六边形为我们传统的数据中心,橙色六边形为次级中心,黄色六边形为第三级中心。低级数据中心数量比高级数据中心数量多,但容量来的小,图中黄色数据中心数量应该是最多的,但为了图例能更简洁的表达思想,并没有将实际数量描述出来,在传统的数据中心架构中,可能我们会设置一些备用的服务器,定期备份数据中心的数据来应对故障,在备份的过程中必然要消耗资源乃至停用部分服务器。离散的数据中心架构,核心数据库通过次级中心向外辐射,数据流流过次级中心时,次级中心即可备份,其次,若核心数据中心遇到协同攻击,由于次级中心的运作,也能保证信息流不受中断。

图2

从无尺度网络理论上看,这种架构将“关键节点”所具有的连接数“亚离散化”了,所谓“亚离散化”,从全局网络看“关键节点”依然具有极大量的连接数,它依然使网络拓扑具有很强的鲁棒性,但是从内部看,“关键节点”的连接被多级离散化了,这样就增加了它面对协同攻击的抵抗力。

参考文献:

【美】 《链接:商业、科学与生活的新思维》

原文发布于微信公众号 - SDNLAB(SDNLAB)

原文发表时间:2017-03-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏BestSDK

50种机器学习和人脸识别API,收藏好!以后开发不用找啦

API 是一套用于构建软件程序的协议和工具。对于应用开发者而言,有了开放的 API,就可以直接调用其他公司做好的功能为我所用,这在很大程度上提升了工作效率。本文...

1783
来自专栏新智元

【深度】基于论文,对谷歌 TPU 的最全分析和专业评价

【新智元导读】本文以 Google 最新公开的 TPU 论文《在数据中心中对张量处理器进行性能分析》的译本为基础,对该论文及 TPU 进行了评价。 源起 2...

5044
来自专栏机器之心

想轻松复现深度强化学习论文?看这篇经验之谈

选自Amid Fish 作者:Matthew Rahtz 机器之心编译 近期深度强化学习领域日新月异,其中最酷的一件事情莫过于 OpenAI 和 DeepMin...

3336
来自专栏人工智能头条

从零实现来理解机器学习算法:书籍推荐及克服障碍的技巧

1485
来自专栏PPV课数据科学社区

从零实现来理解机器学习算法:书籍推荐及障碍的克服

【编者按】并非所有的开发者都有机器学习算法的基础知识,那么开发者如何从零入门来学习好机器学习算法呢?本文总结推荐了一些从零开始学习机器学习算法的办法,包括推荐了...

3275
来自专栏新智元

【解读谷歌TFX】基于TensorFlow可大规模扩展的机器学习平台

【新智元导读】 作者详细分析了Google通用机器学习平台和其实现过程。通过将上述组件集成到一个平台中,能够对组件进行标准化,简化平台配置,并将生产时间从数月缩...

4244
来自专栏AI研习社

2018 最新机器学习 API 推荐清单,快给 APP 加点智能

本篇基于 2017 年的推荐清单做了一些改进——去除了一些不再进行维护的 API,并且更新了一些新的 API。主要覆盖如下方向:

1503
来自专栏腾讯移动品质中心TMQ的专栏

机器学习实现录像分帧速度测试

浏览器测试组一直将录像分帧作为速度测试的重要手段之一。录像分帧具有结果简单直观,证据保存完好等优点。所以,虽然录像分帧在效率上比不上代码埋点,Hook等方法,但...

3121
来自专栏CSDN技术头条

在机器学习模型运行时保持高效的方法

近来,很多人都面临这样一个问题:“机器学习脚本运行时,如何才能避免浪费时间或者拖延呢?”。 我认为这是一个非常好的问题,回答这个问题能显示组织水平和工作上的成熟...

1975
来自专栏人工智能头条

50种机器学习和预测应用的API,你想要的全都有

1817

扫码关注云+社区