检索方法 | 解释 | 功能明细 |
相似性检索 | 支持指定多维向量数值,检索与指定的多维向量数值最相似的 Top K 条文档。 支持指定 id(Document ID),检索与该 id 的向量值最相似的 Top K 条文档。 支持输入原始文本,检索与该文本信息最相似的 Top K 条文档。 支持指定 id、多维向量或原始文本,搭配标量字段的 Filter 表达式一并检索与 id、多维向量、原始文本相似的文档。 支持批量进行相似度检索,即支持输入多条向量数据值、多个 id 分别检索与每一个向量数值、每一个 id 相似的 Top K 条数据。 | |
精确查询 | 基于数据的标量字段(指一个单独的数值,例如文本、数值或日期等字段),精确检索具体数据的查询方式。例如,根据 id(Document ID)查询对应向量数据,或者根据文件名查询。适用于根据单个属性进行数据查询的场景。 | 支持根据指定的文件 id(DocumentSet ID)或文件名,检索对应的文件信息。 支持指定多个文件 id(DocumentSet ID)或文件名,单次批量查询对应的多个文件,最大数量为20个。 支持指定标量字段的 Filter 条件表达式 过滤文件信息。 支持指定查询起始位置和返回数量,查询该范围的文件。 支持指定多个文件 id(DocumentSet ID)或文件名,并搭配标量字段的 Filter 表达式一起过滤数据。 |
过滤检索 | 在精确查询时,支持指定 Filter 字段的条件表达式过滤需查询的文档。 在相似度检索时,支持指定 Filter 字段的条件表达式过滤需检索的文档。 在删除数据时,支持指定 Filter 字段的条件表达式过滤需删除的文档。 在更新数据时,支持指定 Filter 字段的条件表达式过滤需更新的文档。 | |
混合检索 | 支持稠密向量 Dense vector + 稀疏向量 Sparse vector 混合检索双路召回。Sparse vector 通过BM25算法完成分数计算达到类关键字检索效果,进一步提升业务召回效果,弥补在语义检索中对具体数字、编码、数学公式等不敏感以及语义过度泛化的问题。 | 支持文本内容转化稀疏向量表示。 支持 RFF、Weight 两路权重合并排序。 |