文档中心>向量数据库

Document

最近更新时间:2023-12-08 16:15:42

我的收藏
一个 Collection 中可以包含多个 Document。每个 Document 由多个字段(Field)组 Field 成,每个 Field 以键值对(key:value)的形式存储。

管理 Document

腾讯云向量数据库(Tencent Cloud VectorDB)提供了一组 API 接口,用于插入、检索、更新、删除集合中的文档,方便管理集合中的文档。如下表所示。
操作
功能
SDK
详细说明
插入文档
Python:upsert()
Java:upsert()
支持在插入数据时动态修改字段
支持写入原始文本
支持写入向量数据
支持批量插入文档
注意:
若执行 upsert 操作时,指定 Document ID 对应的文档已存在,会先删除原文档,随后插入新数据。
最大支持插入 1000 条数据。

查询文档数据
Python:query()
Java:query()
支持根据 Document ID 查询单条文档
支持根据 Document ID 并结合标量字段的 Filter 表达式查询一条或多条文档
支持指定查询起始位置与返回数量模糊查询多条文档
根据指定 id 字段或 vector 进行相似度检索
返回与指定 Document ID最相近的 Top K 条文档,
返回与指定 Vector 最相近的 Top K 条文档
返回与指定文本最相似的 Top K 条文档
支持批量检索,即输入多个 ID 或多个 Vector 数据批量检索,返回每一个 ID 或每一个 Vector 最相近的 Top K 条文档
删除文档
Python:delete()
Java:delete()
支持根据指定 Document ID 删除单条文档
支持结合标量字段的 Filter 表达式一起过滤需删除的文档
支持批量删除文档
更新文档
Python:update()
Java:update()
支持根据 Document ID 与 标量字段的 Filter 表达式过滤需更新的数据
支持更新旧字段的值
支持新增字段

数据结构

腾讯云向量数据库(Tencent Cloud VectorDB) 支持 vector、string、uint64、double 四种数据结构。
数据结构
说明
vector
向量字段的数据类型,每个向量维度的数据结构为 float32。
string
字符串,主键 ID 与标量字段支持的数据类型之一。
uint64
整型数值,用于存储整数数值,包含正整数、负整数和零。
double
双精度浮点型数值,用于存储浮点值。
array
数组类型,用于存储一组相同类型的数据元素。当前,数组元素仅支持 string 类型。
说明:
主键 ID 字段仅支持 string。
标量字段(包含可创建索引的标量字段)支持 string、uint64、array。