前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >全网第一份 | Flink学习面试灵魂40问,看看你能答上来几个?

全网第一份 | Flink学习面试灵魂40问,看看你能答上来几个?

作者头像
大数据真好玩
发布2019-09-17 12:05:49
9030
发布2019-09-17 12:05:49
举报
文章被收录于专栏:暴走大数据暴走大数据

来源:王知无

作者:王知无

By 暴走大数据

场景描述:这是一份Flink学习面试指北。看看你能通过这?

关键词:Flink 学习 面试

《大数据技术与架构》和《暴走大数据》读者拥有本文的优先阅读权。

转载请联系作者本人。

答案将在下期给出。

概念和基础篇

  • 简单介绍一下Flink
  • Flink相比传统的Spark Streaming有什么区别?和Spark中的structured streaming 相比呢?Flink相比ss和storm有什么优势?
  • Flink的组件栈是怎么样的?
  • Flink的基础编程模型了解吗?
  • 说说Flink架构中的角色和作用?
  • 说说Flink中常用的算子?用过哪些?
  • Flink中的分区策略有哪几种?
  • Flink的并行度有了解吗?Flink中设置并行度需要注意什么?
  • Flink支持哪几种重启策略?分别如何配置?
  • Flink的分布式缓存有什么作用?如何使用?
  • Flink中的广播变量,使用广播变量需要注意什么事项?
  • Flink中对窗口的支持包括哪几种?说说他们的使用场景
  • Flink 中的 State Backends是什么?有什么作用?分成哪几类?说说他们各自的优缺点?
  • Flink中的时间种类有哪些?各自介绍一下?
  • WaterMark是什么?是用来解决什么问题?如何生成水印?水印的原理是什么?
  • Flink的table和SQL熟悉吗?Table API和SQL中TableEnvironment这个类有什么作用?
  • Flink如何实现SQL解析的呢?

进阶篇

  • Flink是如何做到批处理与流处理统一的?
  • Flink中的数据传输模式是怎么样的?
  • Flink的容错机制知道吗?
  • Flink中的分布式快照机制是怎么样的?
  • Flink是如何实现Exactly-once的?
  • Flink的Kafka-connector是如何做到向下兼容的呢?
  • Flink中的内存管理是如何做的?
  • Flink中的序列化是如何做的?
  • Flink中的RPC框架选型是怎么样的?
  • Flink在使用Window时出现数据倾斜,你有什么解决办法?
  • Flink SQL在使用Groupby时出现热点数据,如何处理?
  • 现在我有Flink任务,delay极高,请问你有什么调优策略?
  • Flink是如何处理反压的?和Spark有什么区别?Storm呢?
  • Operator Chains(算子链)这个概念你了解吗?Flink是如何优化的?什么情况下Operator才会chain在一起?

源码篇

  • 讲讲一个Flink job提交的整个流程吗?
  • 讲讲一个Flink job调度和执行的流程吗?
  • Flink所谓"三层图"结构是哪几个"图"?它们之间是什么关系?他们之间是如何转化的?
  • JobManger和TaskManager分别在集群中扮演了什么角色,说说它们都做了些什么?
  • 简单说说Flink数据的抽象和数据的交换过程
  • Flink的分布式快照机制是如何实现的?
  • Flink的反压是如何实现的?
  • 说说FlinkSQL是如何转化的?了解逻辑计划和和物理计划吗?FlinkSQL的维表JOIN是如何做的?了解Async IO吗?解决了什么问题?
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-09-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据真好玩 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档