获取多模态特征向量

最近更新时间:2025-11-07 01:22:21

我的收藏

1. 接口描述

接口请求域名: es.tencentcloudapi.com 。

Embedding是一种将高维数据映射到低维空间的技术,通常用于将非结构化数据,如文本、图像或音频转化为向量表示,使其更容易输入机器模型进行处理,并且向量之间的距离可以反映对象之间的相似性。 本接口有模型维度调用上限控制,单个模型qps限制10,如您有提高并发限制的需求请联系我们

默认接口请求频率限制:20次/秒。

推荐使用 API Explorer
点击调试
API Explorer 提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力。您可查看每次调用的请求内容和返回结果以及自动生成 SDK 调用示例。

2. 输入参数

以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见 公共请求参数

参数名称 必选 类型 描述
Action String 公共参数,本接口取值:GetMultiModalEmbedding。
Version String 公共参数,本接口取值:2025-01-01。
Region String 公共参数,详见产品支持的 地域列表
ModelName String 模型名称,支持WeCLIPv2-Base和WeCLIPv2-Large
示例值:WeCLIPv2-Base
Texts.N Array of String 需进行向量化的文本集,一次输入限10条,单条文本长度限72
示例值:["红色帽子","白色围巾"]
ImageData.N Array of String 输入图片,base64编码格式,一次输入限制8个,单张图片限制1M
示例值:["data:image/jpeg;base64,/AAA/BBB/CCC"]
ImageUrl.N Array of String 输入图片url,一次输入限8个,推荐cos地址,速度更快
示例值:["http://aaa.bb.com/cc"]

3. 输出参数

参数名称 类型 描述
Data MultiModalEmbeddingData 多模态特征向量输出
Usage MultiModalUsage 消耗的tokens和输入图片数量
RequestId String 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。

4. 示例

示例1 获取多模态特征向量

输入示例

POST / HTTP/1.1
Host: es.tencentcloudapi.com
Content-Type: application/json
X-TC-Action: GetMultiModalEmbedding
<公共请求参数>

{
    "ModelName": "WeCLIPv2-Base",
    "Texts": [
        "红色帽子"
    ],
    "ImageData": [
        "data:image/jpeg;base64,/AAA/BBB/CCC"
    ]
}

输出示例

{
    "Response": {
        "RequestId": "b5623e99-ea0c-9509-9b25-20bcc99d03e9",
        "Data": {
            "TextEmbeddings": [
                {
                    "Embedding": [
                        -0.007741480600088835,
                        -0.017921222373843193,
                        -0.04486401379108429,
                        -0.0073757413774728775,
                        0.014934351667761803,
                        -0.025723660364747047,
                        0.03559861704707146,
                        -0.034379489719867706,
                        0.027674268931150436,
                        0.04876523092389107,
                        -0.04266957566142082
                    ],
                    "Index": 0
                }
            ],
            "ImageEmbeddings": [
                {
                    "Embedding": [
                        -0.007741480600088835,
                        -0.017921222373843193,
                        -0.04486401379108429,
                        -0.0073757413774728775,
                        0.014934351667761803,
                        -0.025723660364747047,
                        0.03559861704707146,
                        -0.034379489719867706,
                        0.027674268931150436,
                        0.04876523092389107,
                        -0.04266957566142082
                    ],
                    "Index": 0
                }
            ]
        },
        "Usage": {
            "TotalTokens": 4,
            "TotalImages": 1
        }
    }
}

5. 开发者资源

腾讯云 API 平台

腾讯云 API 平台 是综合 API 文档、错误码、API Explorer 及 SDK 等资源的统一查询平台,方便您从同一入口查询及使用腾讯云提供的所有 API 服务。

API Inspector

用户可通过 API Inspector 查看控制台每一步操作关联的 API 调用情况,并自动生成各语言版本的 API 代码,也可前往 API Explorer 进行在线调试。

SDK

云 API 3.0 提供了配套的开发工具集(SDK),支持多种编程语言,能更方便的调用 API。

命令行工具

6. 错误码

以下仅列出了接口业务逻辑相关的错误码,其他错误码详见 公共错误码

错误码 描述
InternalError 内部错误。
InvalidParameter 参数错误。
InvalidParameterValue 参数取值错误。
MissingParameter 缺少参数错误。
RequestLimitExceeded 请求的次数超过了频率限制。
ResourceNotFound 资源不存在。
UnauthorizedOperation 未授权操作。
UnknownParameter 未知参数错误。
UnsupportedOperation 操作不支持。