GPU作为一种异构资源,k8s社区的管理方案里,资源调度粒度为单个GPU,无法将一个GPU共享给多个Pod,实际业务环境里一个GPU往往支撑多个任务负载,对此社区方案无法很好的支持.GPUManager是腾讯云容器服务TKEStack上自研的GPU资源管理组件,除具备社区版调度功能外,还新增了更细粒度的资源调度、GPU拓扑感知、碎片资源优化等功能,很好的解决了上述问题.本次分享将为大家介绍GPU在K8s集群的使用及GPUManager的架构设计和实现原理,帮助大家在k8s集群上更高效的利用GPU资源.
我来说两句