首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >triton推理服务器:具有输入形状BxN config.pbtxt的部署模型

triton推理服务器:具有输入形状BxN config.pbtxt的部署模型
EN

Stack Overflow用户
提问于 2022-09-28 07:13:51
回答 1查看 101关注 0票数 0

我用码头安装了triton推理服务器,

代码语言:javascript
运行
复制
docker run --gpus=1 --rm -p8000:8000 -p8001:8001 -p8002:8002 -v /mnt/data/nabil/triton_server/models:/models nvcr.io/nvidia/tritonserver:22.08-py3 tritonserver --model-repository=/models

我还创建了火炬脚本模型,使用

代码语言:javascript
运行
复制
from model_ecapatdnn import ECAPAModel
import soundfile as sf
import torch

model_1 = ECAPAModel.ECAPAModel(lr = 0.001, lr_decay = 0.97, C = 1024, n_class = 18505, m = 0.2, s = 30, test_step = 3, gpu = -1)
model_1.load_parameters("/ecapatdnn/model.pt")

model = model_1.speaker_encoder
# Switch the model to eval model
model.eval()

# An example input you would normally provide to your model's forward() method.
example = torch.rand(1, 48000)

# Use torch.jit.trace to generate a torch.jit.ScriptModule via tracing.
traced_script_module = torch.jit.trace(model, example)

# Save the TorchScript model
traced_script_module.save("traced_ecapatdnn_bangasianeng.pt")

现在,您可以看到,我的模型采用了一个形状为(BxN)的张量,其中B是批大小。

如何为这个模型编写config.pbtxt

EN

回答 1

Stack Overflow用户

发布于 2022-09-28 08:53:35

所以找到了答案。必须在config文件中指定形状。这是为我工作的config

代码语言:javascript
运行
复制
name: "ecapatdnn_bangasianeng"
platform: "pytorch_libtorch"
max_batch_size: 1

input[
{
name: "INPUT__0"
data_type:  TYPE_FP32
dims: [-1]
}
]

output:[
{
name: "OUTPUT__0"
data_type:  TYPE_FP32
dims: [512]
}
]
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/73877546

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档