本文档将为您介绍如何通过 TI 平台,一键部署开源大模型,快速试一试模型推理效果,助力用户快速选型适合您业务场景的开源大模型。
第一步:预览 TI 内置大模型清单
![](https://qcloudimg.tencent-cloud.cn/image/document/c16ff7ddf89a2412d0fcbaa1d8f5d278.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/c16ff7ddf89a2412d0fcbaa1d8f5d278.png)
单击模型卡片,可进入每个模型页面查看详细介绍。
![](https://qcloudimg.tencent-cloud.cn/image/document/056b95ed5d3ad21c15182a37af69934b.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/056b95ed5d3ad21c15182a37af69934b.png)
第二步:一键部署开源大模型
在模型详情页面,您可单击新建在线服务按钮,启动部署该大模型。本文档以部署“Llama3系列模型”中的llama_3_8b_chat模型为例。
![](https://qcloudimg.tencent-cloud.cn/image/document/87b6f5c3349e946ff52899908e71d0ef.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/87b6f5c3349e946ff52899908e71d0ef.png)
单击后,平台会自动为您跳转到模型服务 > 在线服务的创建服务参数配置页面。
![](https://qcloudimg.tencent-cloud.cn/image/document/116747db75244f8077443bc84647f43a.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/116747db75244f8077443bc84647f43a.png)
本页面重点参数配置如下:(其余参数都可使用默认值,不修改或按需修改)
服务名称:输入您的自定义服务名称。
计费模式:部署大模型推理服务支持“按量计费”和“包年包月”两种模式都可以。本示例采用“按量计费”。
服务实例
模型来源:选择 “镜像”类型。
模型和运行环境:系统已为您内置默认填充了“内置大模型/Llama3系列模型/llama_3_8b_chat”,也可选择其他内置模型,如Llama3系列下的llama_3_8b、llama_3_70b_chat、llama_3_70b等。
算力规格:本示例选择 12C44GB A10*1 的机器配置,此外还支持V100、A100等机型。
单击同意开源大模型的相关法律协议后,即可单击启动服务按钮。
第三步:在线体验模型效果
创建服务后,前端自动返回模型服务 > 在线服务列表页面,待大模型服务状态为“运行中”中后,表示服务已成功启动运行。
![](https://qcloudimg.tencent-cloud.cn/image/document/cbb194338ece6d413d409f14846a4ca6.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/cbb194338ece6d413d409f14846a4ca6.png)
服务调用分为两种方式:
1. API 调用
其中,需填写到 API Explorer 的“Model”参数取值需参考在线服务>名称>服务管理页面展示的“ ID”参数。
![](https://qcloudimg.tencent-cloud.cn/image/document/f2de632121b41c94c50fc727721a4b2a.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/f2de632121b41c94c50fc727721a4b2a.png)
2. 在线体验
您可以通过单击操作 > 在线体验 按钮进入模型快速体验页面。您可通过前端页面问答形式测试精调后的模型效果。
![](https://qcloudimg.tencent-cloud.cn/image/document/ddcf0ed0182b7377c8c5a212e4595236.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/ddcf0ed0182b7377c8c5a212e4595236.png)
第四步:管理模型服务,查看更多详情信息
您还能通过模型服务 > 在线服务列表页面单击对应服务名称进入详细的服务管理页面。
![](https://qcloudimg.tencent-cloud.cn/image/document/480e8e4f2740f03752f5656e761b90fe.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/480e8e4f2740f03752f5656e761b90fe.png)
您可通过服务管理页面的操作 > 停止/重启按钮控制服务状态,并通过单击“服务详情”的 icon 查看监控/日志;
也可以继续单击服务名称查看更详细的基本信息/实例列表/监控/事件/日志/更新记录等信息。
![](https://qcloudimg.tencent-cloud.cn/image/document/b9955d251729ba3d208bce5bc70abfce.png)
![](https://qcloudimg.tencent-cloud.cn/image/document/b9955d251729ba3d208bce5bc70abfce.png)