大模型推理所需资源指南

最近更新时间:2024-07-25 15:11:11

我的收藏
本文旨在介绍 TI-ONE 平台进行大模型推理时,可保障模型正常运行的配置资源,仅供您参考。

内置大模型的推理资源指南

内置大模型
模型清单
推理使用资源建议
Llama3.1 系列模型
llama-3.1-8b-chat
12C44GB 1卡A10
llama-3.1-70b-chat
164C948G 8卡A100
llama-3.1-8b-base
12C44GB 1卡A10
llama-3.1-70b-base
164C948G 8卡A100
Llama3 系列模型
llama-3-8b-chat
12C44GB 1卡A10
llama-3-70b-chat
164C948G 8卡A100
llama-3-8b-base
12C44GB 1卡A10
llama-3-70b-base
164C948G 8卡A100
Llama2 系列模型
llama-2-7b-chat
1卡V100
llama-2-13b-chat
1卡A100或2卡V100
llama-2-70b-chat
8卡V100
llama-2-7b-base
1卡V100
llama-2-13b-base
1卡A100或2卡V100
llama-2-70b-base
8卡V100
Baichuan2 系列模型
baichuan2-7b-base
1卡V100
baichuan2-7b-chat
1卡V100
baichuan2-13b-base
1卡A100或2卡V100
baichuan2-13b-chat
1卡A100或2卡V100
Chatglm 系列模型
chatglm3-6b-chat
1卡V100
Qwen系列模型
qwen-14b-base
1卡A100或2卡V100
qwen-14b-chat
1卡A100或2卡V100
Bloom 系列模型
bloom-7b-chat
1卡V100
bloomz-7b1-chat
1卡V100
bloom-1b1-chat
1卡V100
bloom-3b-chat
1卡V100
bloomz-3b-chat
1卡V100
金融行业大模型
jinrong-13b-chat
1卡A100或2卡V100
汽车行业大模型
qiche-13b-chat
1卡A100或2卡V100
Baichuan1 系列模型
baichuan-7b-chat
1卡V100
baichuan-13b-chat
1卡A100或2卡V100
Dolly系列模型
dolly-v2-3b-chat
1卡V100
dolly-v2-7b-chat
1卡V100
dolly-v2-12b-chat
1卡A100或2卡V100
Vicuna系列模型
vicuna-7b-v1.5-chat
1卡V100
vicuna-13b-v1.5-chat
1卡A100或2卡V100
Falcon系列模型
falcon-7b-base
1卡V100
falcon-7b-chat
1卡V100
falcon-rw-7b-base
1卡V100
Chinese-alpaca 系列模型
chinese-alpaca-2-7b-chat
1卡V100