TokenHub 支持哪些模型以及如何收费?
在哪里查看我的用量和费用账单?
什么是在线推理服务,为什么我要通过服务来调用模型?
在线推理服务用于管理模型的使用方式,包括计费方式、限流方式等。同一个模型可以创建多个在线推理服务,以区分不同业务场景的使用,因此即使是同一个模型也可能有多个服务,访问时需要通过服务 ID 来明确访问对象。
如何访问模型服务?
平台支持 OpenAI API 协议的调用,您可以在每个模型的详情页参考示例代码完成调用。
访问模型服务有限流吗?
有,每个模型的限流预置可能不同,您可以在模型的详情页查看每个模型的限流规则。