有奖捉虫:办公协同&微信生态&物联网文档专题 HOT

以接入一个应用类 App 的应用搜索为例。通过该示例将展示如何完成一个搜索服务,并了解应用接入的流程。

在 腾讯云搜 TCS 产品介绍页 单击立即申请,进入“腾讯云搜内测申请”页面,提交内测申请。申请审核通过的用户可直接进入腾讯云搜控制台,然后根据系统提示创建应用。

创建应用

创建应用的目的是需要开发者告诉我们应用的基本信息、用于搜索的字段是哪些,并设置好每个字段的搜索属性。

填写基本信息

  • 应用名称:应用的名称,例如,XX公司_XX产品_XX应用。
  • 应用描述:填写所创建的应用信息、需求信息等,以便于管理员审核。

定义应用结构

开发者需要在“定义应用结构”页面配置用于搜索服务的数据。这些数据将用于搜索结果的召回、排序、筛选等。用户可以采用“用户自定义”模板或其他内置模板。其中资讯类模板、小说类模板和应用类模板为典型的数据模板,相对于用户自定义模板,融合了大量纠错、排序方面的经验与模型。

配置文本域字段:
文本域适合于文本类型的数据,是希望被用户搜索到的字段,主要用于搜索结果的召回。

  • 字段名称:数据字段名,仅支持英文和下划线,必填。
  • 字段描述:描述该字段代表的含义,选填,对搜索结果无影响。
  • 数据长度:指该字段文本的最大长度,允许设置一个长文本字段。
  • 重要性:对影响搜索结果排序的因子“文本相关性”造成影响。主要有不重要、一般、重要、很重要和非常重要五种层级。

如应用网站的应用名、应用别名、开发者名、app描述均属于文本域字段。详见下图:

配置数值域字段:
数值域字段适用于数值类型的数据。如评分、下载量、大小、评论量等。该字段中的字符串值必须可以转化为数字,主要用于搜索的排序。

数值域字段必须包含一个主键和权威字段。

  • 主键:用来唯一标识一条数据,该字段用于向您返回结果时使用。此字段必须为可转化为数字的值,该值建议在 uint64_t 的范围内,采用 Hash 值等产生。
  • 权威字段:数值域中最能代表一条数据好坏的数值字段。例如,视频可以以播放量衡量好坏,商城以交易量衡量。云搜排序模块会给予权威数值高的结果进行打分调权,提升排序,权威度低的适当降低排序。
  • 数据类型:用户根据该数值可能的最大范围来选择,如果实际值超过配置的范围,将会出错。经纬度只能选择浮点型。

如应用网站中 appid、下载量、装机量、应用评分数属于数值域字段。其中 appid 属于主键;五星评分数属于权威,最能代表一个应用的重要程度。详见下图:

分类域字段配置:
用于分类检索的字段,主要满足对搜索结果按照分类筛选的需求,不用于搜索。将不进行分词处理,整体创建索引。字段可根据需要添加,如下图,添加完成后,单击保存并下一步

确认明细

明细展示应用之前所填写的所有信息,包括应用基本信息、应用结构等,以便于用户确认。根据页面提示完成确认信息后,由于需要为您配置服务,因此需花费一些时间。

创建成功

创建成功后,如果您是首次使用,建议您选择体验版,可以免费试用一段时间,最多可以拥有5个体验版应用。单击【现在试用】进行试用。如果您已经试用过,也可以直接购买搜索服务,购买流程详见 购买指导

单击现在试用后,您已获得试用权限,将进入如下页面。

数据上传

搜索先要有数据,您需要按照创建应用时设置的字段及属性,提供相应的数据。腾讯云搜现阶段支持 API、SDK、页面文件上传三种方式。

通过 API、SDK 上传数据,请参照 API 使用手册。本文通过页面文件上传的方式体验此功能。接口使用方法详见 API 使用说明

应用管理 > 基本信息中,单击上传数据

数据格式为 json 格式,可参考数据模板添加。如果您的配置为:

则您可以按照如下提供数据:

{
    "content":{
        "TA":"新闻一",
        "TB":"小王家种出了新型可食用植物",
        "NA":"12304",
        "NB":"民生类",
    },
    {
        "TA":"新闻二",
        "TB":"娱乐圈新出一女生组合",
        "NA":"12305",
        "NB":"娱乐类",
    },
    "op_type":"add"
}

搜索

上传数据后,可在应用管理 > 体验测试中体验搜索服务。腾讯云搜还可以通过 API、SDK 检索接口进行搜索,接口使用方法详见 API 使用说明。单击高级搜索可体验更多搜索参数配置。

至此,您已经享受了基本的搜索服务。如果您对搜索服务有更高的需求,可以参照高级组件部分进行配置。同时,可以在应用管理中修改上面创建应用过程中的配置。