首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Flink学习笔记:2、Flink介绍

of Flink that is, Flink’s streaming API....Flink的最新版本重点支持批处理,流处理,图形处理,机器学习等各种功能.Flink 0.7引入了Flink最重要的特性,即Flink的流媒体API。 最初版本只有Java API。...Flink的分布式轻量级快照机制有助于实现高度的容错性。它允许Flink提供高吞吐量性能和保证交付。...Flink为批处理和流数据处理提供API。所以一旦你建立了Flink的环境,它可以容易地托管流和批处理应用程序。事实上,Flink的工作原理是流式处理,并将批处理视为流式处理的特例。...Flink有一套丰富的库来做机器学习,图形处理,关系数据处理等等。由于其架构,执行复杂事件处理和警报非常容易。我们将在随后的章节中看到更多关于这些库的信息。

1.9K50

Flink学习笔记

Flink 初探 设计架构 Flink是一个分层的架构系统,每一层所包含的组件都提供了特定的抽象,用来服务于上层组件,Flink的分层体现有四层,分别是Deploy层、core层、API层/Libraries...层,其中Deploy层主要涉及的是Flink的部署模式及同资源调度组件的交互模式,Core层提供了支持Flink计算的全部核心实现,API层/Libraries层提供了Flink的API接口和基于API...面向流处理支持:CEP(复杂事件处理)、SQL-like的操作(基于Table的关系操作);面向批处理支持:FlinkML(机器学习库)、Gelly(图处理)。...Flink on yarn Flink支持增量迭代,具有对迭代自行优化的功能,因此在on yarn上提交的任务性能略好于 Spark,Flink提供2种方式在yarn上提交任务:启动1个一直运行的 Yarn...分离模式:通过命令yarn-session.sh的启动方式本质上是在yarn集群上启动一个flink集群,由yarn预先给flink集群分配若干个container,在yarn的界面上只能看到一个Flink

88810

flink学习笔记

flink的一些学习笔记,将在github上持续更新 https://github.com/pierre94/flink-notes 一、技术博客索引 Flink中文官方文档 综合类,中文,不全 Flink...官方博客读文档永远是学习的首选方向 Flink中文社区ververicaFlink中文社区,大量学习资料和视频 JarkWu的博客Flink committer,主要是Flink SQL方向 VinoYang...Redis Kerberos (项目包含hadoop思维导图 印象笔记 Scala版本简单demo 常用工具类 去敏后的train code,适合入门学习 zhisheng17的flink博客含 Flink...入门、概念、原理、实战、性能调优、源码解析等内容,适合入门学习。...---待补充 3、比赛 Apache Flink极客挑战赛——Flink TPC-DS性能优化 Apache Flink极客挑战赛——垃圾图片分类 补充中…… 三、学习书籍 《追源索骥:透过源码看懂Flink

1.3K41

Flink学习flink sql「建议收藏」

昨天我们学习完Table API后,今天我们继续学SQL,Table API和SQL可以处理SQL语言编写的查询语句,但是这些查询需要嵌入用Java、Scala和python编写的程序中。...flink sql只需要具备 SQL 的基础知识即可,不需要其他编程经验。我的SQL 客户端选择的是docker安装的Flink SQL Click,大家根据自己的需求安装即可。 目录 1....SQL客户端 SQL客户端内置在Flink的版本中,大家只要启动即可,我使用的是docker环境中配置的Flink SQL Click,让我们测试一下: 输入’helloworld’ 看看输出的结果...总结 今天学习的sql,和往常不一样的地方在于,以往的sql都是处理的是批数据,而今天学习flink sql可以处理流数据,流数据随着时间的变化而变化,flink sql可以对流数据进行类似表一样的处理...参考资料 《Flink入门与实战》 《PyDocs》(pyflink官方文档) 《Kafka权威指南》 《Apache Flink 必知必会》 《Apache Flink 零基础入门》 《Flink

1.2K30

Flink学习笔记(7) -- Flink 并行度详解(Parallel)

Flink的每个TaskManager为集群提供slot。 slot的数量通常与每个TaskManager节点的可用CPU内核数成比例。一般情况下你的slot数是你每个节点的cpu的核数。   ...一个Flink程序由多个任务组成(source、transformation和 sink)。 一个任务由多个并行的实例(线程)来执行, 一个任务的并行实例(线程)数目就被称为该任务的并行度。...为了以并行度3来执行所有的算子、数据源和data sink, 可以通过如下的方式设置执行环境的并行度:   并行度可以在客户端将job提交到Flink时设定。   .../bin/flink run -p 10 WordCount-java.jar   在系统级可以通过设置flink-conf.yaml文件中的parallelism.default属性来指定所有执行环境的默认并行度

1.5K20

Flink CEP学习线路指导1:Flink CEP入门

也就是我们按照下面线路来学习: 1.首先认识Flink CEP 2.Flink CEP原理机制 3.Flink CEP编程 通过上面三部分,我们来学习Flink CEP。...Flink CEP一个复杂事件处理库,它和机器学习库是一样的,也就是Flink CEP是Flink的一个分支,跟机器学习一样是Flink的一个分支。下面是官网的截图,大家可以参考。 ?...下面关于Flink CEP SQL仅供参考 彻底明白Flink系统学习29-1:【Flink1.7】流概念之模式检测 https://www.aboutyun.com/forum.php?...mod=viewthread&tid=26674 彻底明白Flink系统学习29-2:【Flink1.7】流概念之模式检测 https://www.aboutyun.com/forum.php?...上面我们就可以看到他们的不同,当然可能因为我们对于CEP查找匹配还不够了解,那么我们可以继续往下学习Flink CEP图 ? Flink streaming图 ?

2.2K20

Flink学习笔记(8) -- Flink Kafka-Connector详解

Kafka中的partition机制和Flink的并行度机制深度结合   Kafka可以作为Flink的source和sink   任务失败,通过设置kafka的offset来恢复应用 setStartFromGroupOffsets...当job失败重启的时候,Flink会从最近一次的checkpoint中进行恢复数据,重新消费kafka中的数据。   ...表示在checkpoint的时候提交offset, 此时,kafka中的自动提交机制就会被忽略   如果Flink开启了checkpoint,针对FlinkKafkaProducer09 和FlinkKafkaProducer010...setLogFailuresOnly(false) setFlushOnCheckpoint(true) 注意:建议修改kafka 生产者的重试次数 retries【这个参数的值默认是0】   如果Flink...具体的可以参考官方文档 https://ci.apache.org/projects/flink/flink-docs-release-1.6/dev/connectors/kafka.html ?

88020
领券