创建数据集

最近更新时间:2024-07-09 18:04:41

我的收藏

简介

创建数据集功能是由 数据万象(Cloud Infinite,CI)提供的,数据万象将处理能力与 COS SDK 完全结合,您可以直接按照本篇文档指引进行使用。 本文档提供关于创建数据集的相关 API 概览以及 SDK 示例代码。
注意:
该功能需要 COS JAVA SDK v5.6.219.1 及以上版本。旧版本SDK该接口可能未覆盖或缺少更新参数,使用时建议升级到 最新版本
API
操作描述
创建数据集

创建数据集

功能说明

本接口用于创建一个数据集(Dataset),数据集是由文件元数据构成的集合,用于存储和管理元数据。

方法原型

public CreateDatasetResponse createDataset(CreateDatasetRequest customRequest)

请求示例

CreateDatasetRequest request = new CreateDatasetRequest();
request.setAppId("1234567890");
// 设置数据集名称,同一个账户下唯一。命名规则如下: 长度为1~32字符。 只能包含小写英文字母,数字,短划线(-)。 必须以英文字母和数字开头。;是否必传:是
request.setDatasetName("test");
// 设置数据集描述信息。长度为1~256个英文或中文字符,默认值为空。;是否必传:否
request.setDescription("test");
// 设置 与数据集关联的检索模板,在建立元数据索引时,后端将根据检索模板来决定采集文件的哪些元数据。每个检索模板都包含若干个算子,不同的算子表示不同的处理能力,更多信息请参见 [检索模板与算子](https://cloud.tencent.com/document/product/460/106018)。 默认值为空,即不关联检索模板,不进行任何元数据的采集。;是否必传:否
request.setTemplateId("Official:COSBasicMeta");

CreateDatasetResponse response = client.createDataset(request);

参数说明

Request: 中的具体数据描述如下
参数名称
描述
类型
是否必传
AppId
是您在成功申请腾讯云账户后所得到的账号,由系统自动分配,具有固定性和唯一性,可在 账号信息 中查看。通过控制台创建存储桶时,无需用户输入,而在使用工具、API、SDK 时则需要指定 APPID。
String
datasetName
数据集名称,同一个账户下唯一。命名规则如下: 长度为1~32字符。 只能包含小写英文字母,数字,短划线(-)。 必须以英文字母和数字开头。
String
description
数据集描述信息。长度为1~256个英文或中文字符,默认值为空。
String
templateId
与数据集关联的检索模板,在建立元数据索引时,后端将根据检索模板来决定采集文件的哪些元数据。每个检索模板都包含若干个算子,不同的算子表示不同的处理能力,更多信息请参见 检索模板与算子
默认值为空,即不关联检索模板,不进行任何元数据的采集。
String
响应参数说明: CreateDatasetResponse 中的具体数据描述如下:
参数名称
描述
类型
requestId
请求 ID
String
dataset
数据集信息
Container
Dataset 中的具体数据描述如下:
参数名称
描述
类型
region
园区信息
String
templateId
检索模板
String
description
数据集描述信息
String
createTime
数据集创建时间的时间戳,格式为 RFC3339Nano
String
updateTime
数据集修改时间的时间戳,格式为 RFC3339Nano
创建数据集后,如果未更新过数据集,则数据集修改时间的时间戳和数据集创建时间的时间戳相同
String
bindCount
数据集当前绑定的 COS Bucket 数量
Integer
fileCount
数据集当前文件数量
Integer
totalFileSize
数据集中当前已建立了元数据索引的文件的总大小,单位为字节。
Integer
datasetName
数据集名称
String

返回结果说明

成功:返回 CreateDatasetResponse 对象响应信息。
失败:发生错误(如 Bucket 不存在),抛出异常 CosClientException 或者 CosServiceException。详情请参见 异常处理