词汇表

最近更新时间:2024-11-11 17:25:53

我的收藏

C

CLS

参见 日志服务

F

分词

  • 在腾讯云搜中,分词是指在一个文档中按照语义将句子切割成有意义的单词的过程。
  • 在日志服务中,分词是指在一个较长的日志中,按照符号或中文将日志切分为多个片段以便于检索的过程。详细说明及示例请参见 分词与索引

J

键值索引

键值索引(Key-Value Index)将原始日志按字段(即 key:value)分别切分为多个分词进行索引构建,检索时基于键值方式进行检索(即键值检索)。详细介绍请参见 配置索引

机器组

机器组(MachineGroup)是一组需要采集日志的机器列表,日志服务通过机器组来管理所有需要通过 LogListener 采集日志的机器。详细说明及示例参见机器组

L

LogListener

LogListener 是腾讯云日志服务所提供的日志采集客户端,其按照预设的采集策略实时上报日志数据,使用方式参见 LogListener 使用流程

Q

全文索引

全文索引(Full-Text Index)将原始日志整体切分为多个分词进行索引构建,检索时直接通过关键词进行检索(即全文检索)。详细介绍请参见 索引配置

R

日志

日志(Log)是应用系统运行过程中产生的记录数据,如用户操作日志、接口访问日志、系统错误日志等。日志通常以文本的形式存储在应用系统所在的机器上,一条系统运行记录对应的日志可能为一行文本(单行日志),也可能为多行文本(多行日志)。详细说明及示例参见 日志与日志组

日志服务

日志服务(Cloud Log Service,CLS)提供一站式的日志数据解决方案。您无需关注扩缩容等资源问题,五分钟快速便捷接入,即可享受日志的采集、存储、加工、检索分析、消费投递、生成仪表盘、告警等全方位稳定可靠服务。全面提升问题定位、指标监控的效率,大大降低日志运维门槛。

日志集

日志集(Logset)是对日志主题的分类,一个日志集可包含多个日志主题。日志集本身不存储任何日志数据,仅方便用户管理日志主题。详细说明及示例请参见 日志主题与日志集

日志主题

日志主题(Topic)是日志数据在日志服务(Cloud Log Service,CLS)平台进行采集、存储、检索和分析的基本单元,采集到的海量日志以日志主题为单元进行管理,包括采集规则配置、保存时间配置、日志检索分析以及日志下载/消费/投递等。
一个日志主题通常对应某一个应用/服务,建议将同一个应用/服务在不同机器上的同类日志采集到同一个日志主题。详细说明及示例请参见 日志主题与日志集

S

索引

  • 在 Elasticsearch Service 中:
    • 索引(名词)类似于传统关系数据库中的一个数据库,是存储关系型文档的地方。索引的复数词为 indices 或 indexes。
    • 索引(动词)一个文档就是存储一个文档到一个索引(名词)中,以便它可以被检索和查询。除了文档已存在时新文档会替换旧文档情况之外,这类似于 SQL 语句中的 INSERT 关键词。
  • 在日志服务中:
    为了快速检索出需要的日志,日志服务对上传至平台的日志进行包括分词在内的很多预处理,这个过程称之为创建“索引(index)”。索引决定了日志能够以什么样的条件来进行检索和分析,因此在上传日志数据前,需要为日志主题设置一个合理的索引规则,以方便后续检索分析。索引主要包括全文索引及键值索引两类,详细介绍请参见 配置索引
  • 在向量数据库中:
    索引(Index)是一种特殊的数据结构,用于快速查找和访问数据,存储在内存中。索引本身并不存储数据,而是存储指向数据存储位置的指针或键值对。Tencent Cloud VectorDB 支持 FLAT、HNSW 等常见的向量索引。索引介绍详见 向量检索

Y

元数据

元数据(Tag)是对日志本身的描述或分类,例如容器日志对应的容器集群或 Pod 信息。上传日志到日志服务时,元数据通过 LogTag 字段传递(详情可参见 上传结构化日志 中的LogTag字段 ),而原始日志内容通过 Log 字段传递。所有通过LogTag 传递的数据,配置索引时,均需配置 元数据索引
在统一元数据平台(Unified MetaData Platform,UDP)中,用于描述数据的数据,又称中介数据、中继数据,主要是描述数据属性的信息,包括库表关系等技术元信息,以及数据分层、标签等业务元信息。