前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >通过StreamSets实时更新数据至ElasticSearch

通过StreamSets实时更新数据至ElasticSearch

原创
作者头像
Qwe7
发布2022-03-24 08:13:41
1.3K0
发布2022-03-24 08:13:41
举报
文章被收录于专栏:网络收集

网上许多关于StreamSets增量更新的教程几乎都是单单INSERT操作,这使得目标数据库会出现重复数据,而实际需求上我们往往更多是需要INSERTUPDATE操作,利用SQL ServerTIMESTAMP(时间戳)特性,可以很容易实现这一点。

源数据库配置

  需要明白一点,在SQL Server中的TIMESTAMP和时间无关,每次对INSERTUPDATE操作,对于TIMESTAMP列所在的行中的值均会更新。   将时间戳字段LastTimestamp作为偏移量填入Offset Column处,偏移量初始值Initial Offset设为0。

时间戳处理

  由于ElaticSearch没有TIMESTAMP或相似的类型,故作了转换处理,即上图的BIGINT类型,而直接将转换后的数据映射到目标数据库却会报错,我暂时不知道怎么解决,就通过Field Remover做个移除。

目标数据库配置

  注意Default Operation需要选择UPDATE with doc_as_upsert

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 源数据库配置
  • 时间戳处理
  • 目标数据库配置
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档