内置训练镜像列表

最近更新时间:2024-05-24 17:17:01

我的收藏

简介

TI-ONE 内置了主流的 TensorFlow、Pytorch、PySpark 等深度学习和机器学习框架,同时推出了自研训练加速框架 Angel,其中 tilearn-llm 是为大模型定制的训练加速组件,已内置在平台通用训练镜像中,同时支持 Notebook 和任务式建模。

内置镜像列表

镜像名称
版本
支持的训练模式
备注
TensorFlow
ti-acc1.0-tf1.15-py3.6-cuda10.0-gpu
PS-Worker

tf1.15-py3.7-cpu
PS-Worker,MPI,Horovod

tf1.15-py3.7-cuda10.0-gpu

tf2.4-py3.8-cpu

tf2.4-py3.8-cuda11.1-gpu

PyTorch
tilearn-llm1.0-torch2.1-angel-vllm1.0-py3.10-cuda12.1-gpu
DDP
最新 LLM 训练和推理加速镜像,包含3d并行训练加速能力;同时内置了 angel-vllm 推理加速库,用户可以在notebook 中快速体验量化加速效果,同时支持任务式建模 Notebook
tilearn-llm0.4.2-torch2.1-deepspeed0.10.0-py3.10-cuda12.1-gpu
DDP
旧版 LLM 训练加速镜像,支持训练加速(不支持3d并行),最新加速能力请使用 tilearn-llm1.0 镜像,同时支持任务式建模和 Notebook
ti-acc2.0-torch1.12-tf1.15-tf2.4-pyspark2.4.5-py3.8-cuda11.3-gp
-
旧版 Notebook 多 kernel 镜像,内置 CV 模型训练加速库 ti-acc,同时内置torch,tf,pyspark 等运行环境,可在一个镜像内切换 kernel 使用,仅支持 Notebook
ti-acc1.0-torch1.9-py3.8-cuda11.1-gpu
DDP
CV 模型训练加速镜像,支持训练加速,仅支持任务式建模
torch1.9-py3.8-cuda11.1-gpu
DDP,MPI,Horovod
pytorch 训练镜像,仅支持任务式建模
torch2.1-py3.8-npu
DDP,MPI,Horovod
可以在910b机器上运行,同时支持任务式建模 Notebook
Spark
spark2.4.5-cpu
Spark

PySpark
spark2.4.5-py3.6-cpu
Spark