简介
TI-ONE 内置了主流的 TensorFlow、Pytorch、PySpark 等深度学习和机器学习框架,同时推出了自研训练加速框架 Angel,其中 tilearn-llm 是为大模型定制的训练加速组件,已内置在平台通用训练镜像中,同时支持 Notebook 和任务式建模。
内置镜像列表
镜像名称 | 版本 | 支持的训练模式 | 备注 |
TensorFlow | ti-acc1.0-tf1.15-py3.6-cuda10.0-gpu | PS-Worker | |
| tf1.15-py3.7-cpu | PS-Worker,MPI,Horovod | |
| tf1.15-py3.7-cuda10.0-gpu | | |
| tf2.4-py3.8-cpu | | |
| tf2.4-py3.8-cuda11.1-gpu | | |
PyTorch | tilearn-llm1.0-torch2.1-angel-vllm1.0-py3.10-cuda12.1-gpu | DDP | 最新 LLM 训练和推理加速镜像,包含3d并行训练加速能力;同时内置了 angel-vllm 推理加速库,用户可以在notebook 中快速体验量化加速效果,同时支持任务式建模 Notebook |
| tilearn-llm0.4.2-torch2.1-deepspeed0.10.0-py3.10-cuda12.1-gpu | DDP | 旧版 LLM 训练加速镜像,支持训练加速(不支持3d并行),最新加速能力请使用 tilearn-llm1.0 镜像,同时支持任务式建模和 Notebook |
| ti-acc2.0-torch1.12-tf1.15-tf2.4-pyspark2.4.5-py3.8-cuda11.3-gp | - | 旧版 Notebook 多 kernel 镜像,内置 CV 模型训练加速库 ti-acc,同时内置torch,tf,pyspark 等运行环境,可在一个镜像内切换 kernel 使用,仅支持 Notebook |
| ti-acc1.0-torch1.9-py3.8-cuda11.1-gpu | DDP | CV 模型训练加速镜像,支持训练加速,仅支持任务式建模 |
| torch1.9-py3.8-cuda11.1-gpu | DDP,MPI,Horovod | pytorch 训练镜像,仅支持任务式建模 |
| torch2.1-py3.8-npu | DDP,MPI,Horovod | 可以在910b机器上运行,同时支持任务式建模 Notebook |
Spark | spark2.4.5-cpu | Spark | |
PySpark | spark2.4.5-py3.6-cpu | Spark | |