首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

MLSys提前看 | 机器学习的分布式优化方法

随着机器学习算法和模型的不断发展,传统的软硬件平台、部署环境等无法支撑机器学习的应用,这也成为了目前机器学习方法落地及大规模推广应用的主要困难之一。目前,有关于 MLSys 的研究方向包括硬件领域、软件领域和对机器学习算法的改进三个方面,以 MLSys 2020 为例,本届大会的议题包括:Distributed and parallel learning algorithms(5 篇论文)、Efficient model training(8 篇论文)、Efficient inference and model serving(8 篇论文)、Model/Data Quality and Privacy(4 篇论文)、ML programming models and abstractions & ML applied to systems(5 篇论文)以及 Quantization of deep neural networks(4 篇论文)。整个会议一共录用 34 篇论文。

04
您找到你想要的搜索结果了吗?
是的
没有找到

思考一下,联邦学习可以训练大语言模型吗?

随着大语言模型(Large Language Model,LLM)的火速发展,关于大语言模型对人工智能产业发展的影响引发了越来越多的讨论。一种观点认为,大语言模型的发展摧毁了人工智能初创企业的发展之路,因为大语言模型参数多,所需要的算力规模大,所依赖的训练数据规模也大。大模型、大参数、大数据实际都集中在大的人工智能企业,从而导致初创企业的机会越来越少。另外一种观点则相反,他们认为,大语言模型的发展一定程度成促进了人工智能在多个领域中的广泛发展,例如可以直接在大语言模型的基础上利用私有数据搭建一些垂直领域的大语言模型,可以直接将大语言模型应用在不同的业务场景中等等。

02

vivo AI 计算平台的K8s填坑指南

在 2018 年底,vivo AI 研究院为了解决统一的高性能训练环境、大规模的分布式训练、计算资源的高效利用调度等痛点,着手建设 AI 计算平台。白驹过隙,将近两年时间过去了,平台的建设和落地取得了很大的进展,成为了 vivo AI 领域的核心基础平台。平台现在已经有超过 500 多个用户,来自人工智能、影像、互联网等多个部门。平台的容器集群有 1000 多台服务器,拥有 50000 多 CPU 核,1000 多张 GPU 卡,GPU 算力将近 100 PFLOPS。每天运行 1000 多个的算法训练任务,部署了 100 多个的模型推理服务和 AI 应用。这些训练任务和应用都是以容器的方式运行。平台从当初服务深度学习训练为主,到现在演进成包含 VTraining、VServing、VContainer 三大模块,对外提供模型训练、模型推理和容器化的能力。

01
领券