文档中心>对象存储>数据处理>智能检索 MetaInsight

智能检索 MetaInsight

最近更新时间:2024-09-26 18:04:52

我的收藏

产品简介

智能检索 MetaInsight 为您提供多场景、跨模态的检索服务,您可以通过自然语言或结构化的检索条件,分析存储在对象存储 COS 中的文件,满足您对存储数据的管理、分析、检索需求。
智能检索利用数据万象已有的图片、视频、语音、文档等数据处理能力,提取文件的特征或元数据并索引到数据集中,为您提供文件的聚合统计查询、人脸图像检索、图片内容检索等能力。

使用限制

智能检索需绑定 COS 存储桶使用,您需要先 开通对象存储服务 并绑定存储桶。
地域限制:仅支持绑定北京、上海地域的存储桶,仅支持对北京、上海地域的 COS 文件建立元数据索引。
不同操作中的参数限制,详见 智能检索 API 接口文档

计费说明

智能检索 MetaInsight 的费用包含算子处理费用、检索费用和元数据管理费用,在2025年1月1日之前属于公测阶段,公测期间您可以免费使用,公测结束后有关智能检索的计费详细介绍,请参见 智能检索费用

功能说明

功能
功能描述
管理数据集
数据集是由文件元信息和特征所组成的集合,是存放文件元数据索引的容器。创建数据集后,智能检索 MetaInsight 可以自动解析在对象存储 COS 中文件的基础信息,对图片、视频、音频等媒体文件进行人工智能分析,提取标签、人物等信息并建立元数据索引。您也可以为存储在对象存储 COS 中的文件手动建立元数据索引。
文件元信息查询
通过对文件元信息不同字段的筛选分析,可以查询满足指定条件的文件,并按照指定字段和排序方式列出文件信息。
根据图片检索图片
通过输入图片,用以图搜图的方式可快速在数据集中检索到与输入图片相似的前 N 张图片。
语义检索图片
可以根据图片内容输入自然语言进行检索,例如“一片大海”、“一颗饱满的草莓”等图片内容。
人脸检索
您可以使用人脸搜索功能从数据集中搜索与指定图片中人脸最相似的前 N 张图片,适用于门禁闸机、签到考勤、学校宿舍管理等场景。

适用场景

海量文件统计查询

通过智能检索 MetaInsight ,您可以从上亿的海量文件中查找符合特定条件的文件或统计出符合特定条件的文件数量。例如查询包含某个关键词的文件,统计某个目录下的文件大小,查询包含某个人物的图片等,您也可以结合您具体的业务情况,通过组合简单查询条件以及聚合操作,做更多场景的数据检索。

数据挖掘

在大数据场景中,采集到的海量图片数据可通过智能检索进行数据预分类,过滤筛选出指定场景的数据后再进行标注训练,可大大提升数据训练效率。

智能相册

使用人脸搜索功能,在图库中搜索与指定人脸最相似的前N张图片,结果按相似度降序排列。在智能相册中可将已经识别的人脸与通讯录进行关联,完成关联后,可在看照片时直接点击照片上的人脸进行打电话、发短信等操作。

电商网站

通过输入商品图片,可以在商品库中准确地找到图片中商品的同款或者相似款,并快速返回对应的商品信息。

使用流程

步骤一:创建数据集

数据集是由文件元信息和特征所组成的集合,是存放文件元数据索引的容器。创建数据集后,智能检索 MetaInsight 可以自动解析在对象存储 COS 中文件的基础信息,并对图片进行智能分析,提取特征建立元数据索引。例如在电商场景中,您创建一个电商图库数据集,通过绑定存储桶与数据集接口将某个存储桶与数据集进行绑定,或通过创建元数据索引接口,为后续产生的电商商品图片建立元数据索引,然后使用图片检索功能,用户可以通过自然语言或相似商品图对电商图库中的图片进行检索。具体操作请参见 数据集管理控制台指南
说明:
在创建数据集时,可以数据集设置检索模板(Template),检索模板定义了数据集创建元数据索引时需要执行的算子操作,不同的算子将提取不同类型的元数据,详情请参见 检索模板与算子

步骤二:建立元数据索引

创建数据集后,您可以为存储在对象存储 COS 中的文件建立元数据索引。通过丰富的元数据索引,MetaInsight可以为您提供强大的数据聚合查询、分析和管理能力。我们提供了两种建立元数据索引的方式:
方式一:绑定 COS 存储桶与数据集,自动建立元数据索引,绑定存储桶后,MetaInsight会先扫描桶内存量数据,当存量数据索引完成后,会继续扫描桶内新增的文件并建立索引,详情请参见 数据集管理控制台指南
方式二:通过接口手动建立元数据索引,详情请参见 创建元数据索引

步骤三:数据检索

元数据索引建立完成后,您可以在控制台或通过 API 接口进行基础文件信息查询、以图搜图、以文搜图、人脸搜索等操作,详情请参见 简单查询图像检索人脸搜索