首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Exxact与Run:ai合作,最大化利用GPU集群的AI工作负载

Exxact是致力于高性能计算(HPC)、人工智能(AI)和数据中心解决方案的供应商。其开发和制造高性能计算平台和解决方案,包括工作站、服务器、集群和为深度学习、生命科学、高性能计算、大数据、云等开发的存储产品。

现在在他们的解决方案中将提供Run:ai开创性的基于kubernetes的编排工具,集成了一个专门用于管理AI集群中GPU资源的高性能超级调度器。

Run:ai的一个创新的云原生操作系统——包括一个工作负载感知调度器和抽象层——帮助IT简化AI实现,提高团队生产力,并充分利用昂贵的GPU。可以根据AI工作负载动态优化硬件利用率,使集群以最高效率运行。

硬件被分解到一个共享池中,Run:ai的超级调度器在团队的工作之间分配GPU资源。数据科学家可以轻松利用大量的GPU计算。可以查看集中且高度透明的界面,以监视资源供应、作业队列和利用率百分比。在低峰值时,Run:ai会自动分配未使用的资源,以加速现有作业并最大化利用资源。因此,可以更快地创建和训练AI模型,同时最大限度地减少闲置GPU的资源浪费。

Run:ai联合创始人兼首席执行官OmriGeller表示,该公司的目标是让IT团队在昂贵的GPU上获得最大的投资回报,并实现对AI计算资源的民主访问。通过将Run:ai软件插入Kubernetes环境中,可以控制和优先考虑AI工作负载,并为AI从业者提供简单和可扩展的方式来运行工作负载。

Geller说:“深度学习正在创造全新的行业,并改造旧的行业。”“现在是时候让计算适应深度学习了。Run:ai为IT和数据科学家提供了从GPU中获得最大收益所需的东西,因此他们可以更快地创新和迭代模型,以生产出未来先进的AI。”

通过与Run:ai合作,利用动态的GPU编制和资源分配,Exxact可以帮助客户释放其AI集群性能的全部潜力。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20221213A00W2500?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券