学习
实践
活动
工具
TVP
写文章

网络操作系统的功能有哪些?

网络操作系统可以处理海量并发通信,使节点拥有上千的通信并发度,同一时间内通信接口需要处理数千个通信请求。同时网络带宽快速增长,使通信接口拥有更多的通信资源调度管理。

复杂的多层次通信语义、大量的通信请求和通信资源将对通信接口的控制层面(通信运行时环境的功能、性能和扩展性)提出新的需求。运行于网络硬件之上的通信运行时环境将是互联网络的“操作系统”,保障大量通信进程对通信硬件高效地使用(也包括实现互联网络高效的路由算法和拥塞控制),首先要提供更加易用的接口和灵活高效的调度管理。

在调度管理方面,如何提高通信吞吐率?首先,受限于NIC资源,CRT需要研究调度方法来解决NC缓存中通信上下文切换失效的问题;其次,CRT需要研究如何合并减少通信请求压力,比如减小消息的数量,采用小消息合并等优化方法;最后,CRT需要研究并提供服务质量,以满足较急迫的通信请求,并可以采用小消息优先等调度方法提高通信吞吐率。

在易用性方面,首先,在千核环境下,缓存一致性极可能不再给予维护,传统节点内共享内存的通信方法不再适用,因此需要研究利用片上网络提供千核虚拟一致性的地址空间来简化编程复杂性。其次,异构部件的使用导致节点内主从部件的物理划分,如何在编程接口上屏蔽主从部件的差异将成为研究的重点。最后,对于节点间的大规模通信,用户难以显式地对网络通信状况进行管理和监控,网络在可管理性方面将面临挑战,需要在CRT层面研究网络大规模通信的管理和反馈机制。针对大规模集合通信的性能优化也将是研究的重点,包括如何实现最新MPI-3标准中非阻塞集合通信以及邻居通信模型等。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190830A0RVYC00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券