2011aad

LV1
  • 原创分享作者

发表了文章

基于Spark的ID Mapping——Spark实现离线不相交集计算

最近在开发一个ID Mapping业务系统——识别数据上报中社交账号的关联关系,找到系统中哪些社交账号属于现实世界中的同一个人。简单来讲,如果同一条上报数据中出...

2011aad
spark
订阅了专栏

Snova云数仓

Snova云数仓官方专栏

16 文章92 关注者
订阅了专栏

腾讯数据库技术

53 文章217 关注者
关注了用户

腾讯云中间件团队

10 文章0 回答45 关注者
发表了文章

Flink源码走读(一):Flink工程目录

导语 | Flink已经成为未来流计算趋势,目前在很多大厂已经有了大规模的使用。最近在学习Flink源码,就想把自己学习的过程分享出来,希望能帮助到志同道合的朋...

2011aad
大数据解决方案
发表了文章

Flink源码走读(二):Flink+Kafka实现端到端Exactly Once语义

Flink通过Checkpoint机制实现了消息对状态影响的Exactly Once语义,即每条消息只会影响Flink内部状态有且只有一次。但无法保证输出到Si...

2011aad
大数据解决方案Kafka
创建了专栏

Flink源码走读

3 文章6 关注者

个人简介

个人成就

  • 影响力总排行第 2746 名
  • 原创分享作者
    • 原创分享作者

  • 获得 26 次赞同
  • 文章被阅读 780 次
  • 文章获得 2 次首页推荐

扫码关注云+社区

领取腾讯云代金券

玩转腾讯云 有奖征文活动