有奖捉虫:办公协同&微信生态&物联网文档专题 HOT

Elasticsearch 离线单表读取节点配置




参数
说明
数据源
选择当前项目中可用的 Elasticsearch 数据源。
索引
支持多个索引名称或正则表达式。索引名称正则表达式请使用通配符(*),如 index_*。
ES 版本
根据数据源和索引确定 ES 版本。
切割键
指定用于数据分片的字段,指定后将启动并发任务进行数据同步。您可以将源数据表中某一列作为切分键,建议使用主键或有索引的列作为切分键。
检索条件(选填)
使用 JSON 格式进行检索。

Elasticsearch 离线单表写入节点配置




参数
说明
数据源
选择当前项目中可用的 Elasticsearch 数据源。
索引
ElasticSearch 中的索引名称。
动态映射
定义当在文档中发现未存在的字段时,同步任务是否通过 Elasticsearch 动态映射机制为字段添加映射。
打开:保留 Elasticsearch 的自动 mappings 映射。
关闭:默认关闭,根据同步任务配置的 column 生成并更新 Elasticsearch 的 mappings 映射。
Elasticsearch 7.x 版本的默认 type 为_doc。使用 Elasticsearch 的自动 mappings 时,请配置 _doc 和 esVersion 为7。
清理原索引数据
手动选择是否清理原索引数据:
否:导入数据前保留索引中已存在的数据。
是:导入数据前删除原来的索引并重建同名索引,此操作会删除该索引下的数据。
写入方式
支持插入和更新两种写入方式:
插入:所有数据直接插入。
更新:存在相同主键时更新数据,否则插入。
主键取值方式
支持三种取值方式:
源表主键: document 的 id 使用源表的主键。
联合主键: document 的 id 使用源表的多个列共同确定。
无主键: 默认生成_id 值。
批量提交大小
一次性批量提交的记录数大小,该值可以极大减少数据同步系统与 ElasticSearch 的网络交互次数,并提升整体吞吐量。如果该值设置过大,会导致数据同步运行进程 OOM 异常。
高级设置(选填)
可根据业务需求配置参数。