我正在试着找出一个问题的解决方案。我们有一些可用的计算资源可供我们使用-一台具有48 GB RAM、1,1080个Ti GPU、1 Ti的计算机。我们希望将这些资源分配给公司的项目。如何在给定的场景中确定哪个项目应该具有更高的优先级。
公司收到一个请求,要求提高现有客户的深度学习解决方案的效率,该客户是一位有价值的客户。
同时,它收到了另一项任务,涉及为潜在客户完成概念证明,涉及深度学习。
这两个任务都可能会消耗所有可用资源。
硬约束-仅使用本地计算资源。
发布于 2020-08-27 22:24:33
一种可能是运行Kubernetes并管理pods。这允许虚拟化您的服务器、网络、服务、数据库等,并允许紧密打包。
您可以在本地基础设施上运行Kubernetes。
有点陡峭的学习曲线,但让你完全控制。
顺便说一句,我假设这些计算资源是用于加速项目的投资,而不是生产硬件。对于生产,您可能需要分离关注点。因此,在相同的硬件上打包很多可能会带来风险(当一个部门/子系统的模块行为错误时,它可能会对其他部门/子系统产生负面影响)。是的,虚拟化应该阻止它,总的来说,它确实是这样做的。但软件并不完美,风险也不是零。所以,也要记住这一点。
阅读材料:
https://stackoverflow.com/questions/63617639
复制相似问题