我真的需要Flink检查点吗？_我真的需要写“ngInject”吗？_这里真的需要`as`吗？ - 腾讯云开发者社区

、

我有一个Flink应用程序，它从Kafka读取一些事件，从MySQL中丰富数据，使用窗口函数缓冲数据，并将窗口中的数据写入HBase。我目前已经启用了检查点，但它被证明是相当昂贵的检查点，随着时间的推移，它需要越来越长的时间，并影响我的工作的延迟(落后于kafka摄取率)。如果我想出一种方法让我的HBase写成幂等，有没有充分的理由让我使用检查点？我可以配置内部的kafka消费者客

浏览 9提问于2019-10-08得票数 0

1回答

从外部化检查点问题恢复Flink

、、

我使用的是在从docker-flink安装的ECS中运行的Flink。我已经通过flink-conf.yaml中的state.checkpoints.dir到S3启用了外部检查点到AWS S3。现在，根据Flink文档here，如果我们想在出现故障的情况下从检查点恢复，我们必须使用bin/flink run -s :checkpointMetaDataPath [:runArgs]，但我使用FLINK_HO

浏览 35提问于2020-04-03得票数 0

回答已采纳

1回答

flink什么时候会考虑一个检查点的完成？在水槽功能之前还是之后？

、

flink什么时候会考虑一个检查点的完成？有两种方式： flink将在所有接收器函数都收到检查屏障N后立即考虑检查点N完成。当所有接收器功能成功地处理了屏障N时，flink将考虑检查点N完成。哪一个是真的？因为我能找到任何关于这件事的文件。

浏览 1提问于2021-04-28得票数 1

回答已采纳

1回答

Flink增量检查点，Flink会自动删除旧检查点文件吗？

对于Flink增量检查点，如果我正确理解它，它将首先创建一个完整的检查点，然后它将在以前的基础上每次创建一个增量检查点。这条链子会很长吗？在恢复时，我们需要从第一个完整的检查点申请吗？我听说Flink会定期进行压缩/合并，这是否意味着它会周期性地创建一个完整的检查点，这样我们在恢复过程中就不需要进入非常老的完整检查点了吗？如果是的话，

浏览 3提问于2019-09-20得票数 1

回答已采纳

1回答

Flink，检查点的基本规则？

、

我有两个关于Flink检查点策略的问题，我知道检查点与状态相关(对吗？)，所以如果我没有在作业代码中显式地使用状态(ValueState之类的东西)，我需要关心检查点吗？还需要吗？如果我需要启用检查点，间隔应该是什么？是否有设置间隔的基本规则？假设我们谈论的是一个相当繁忙的系统(Kafka+Flink)，

浏览 2提问于2019-03-07得票数 1

回答已采纳

1回答

为什么flink检查点的创建有这么大的不同？

我能以某种方式获得更多细节吗?在创建flink检查点时发生了什么？创建flink检查点的时间因因子10不同。这至少是职务经理日志文件告诉我的：2017-02-14 09:08:17,447 I

浏览 2提问于2017-02-14得票数 1

回答已采纳

1回答

在执行纱线应用程序杀死并再次运行后，flink是否会从上一次偏移恢复？

、、

我使用FlinkKafkaConsumer来使用kafka并启用检查点。现在，我对偏移管理和检查点机制有点困惑。我已经知道flink将开始从使用者组的. https://ci.apache.org/projects/flink/flink-docs-stable/dev/connectors/kafka.html#kafka-consumers-start-position

浏览 6提问于2019-11-04得票数 2

回答已采纳

1回答

用于增量rocksdb检查点的Flink键控状态清理

、

我们有一个flink作业，将持续在rocksdb后端的大键控状态。我们正在使用增量检查点策略。随着时间的推移，状态的大小成为一个问题。如果我真的需要增量检查点，那么解决此问题的最佳方法是什么？

浏览 2提问于2018-12-13得票数 0

1回答

Flink中保存点与检查点的差异

我知道堆叠溢出也有类似的问题，但在调查了其中的几个问题后，我知道了。如果由于某种原因需要关闭或重新启动整个应用程序(例如错误修复或意外崩溃)，那么我必须使用savepoint来恢复整个应用程序吗？我认为checkpoint仅在Flink中用于运行

浏览 3提问于2019-02-04得票数 2

1回答

Flink的故障恢复过程

我想知道flink.In单机模式的详细故障恢复过程，我猜有一些步骤，比如TaskManager故障，首先检测故障，所有任务停止处理，然后重新部署任务。然后从HDFS下载检查点，每个操作员加载状态。我说的对吗？有没有人知道正确和详细的恢复过程？

浏览 3提问于2019-04-03得票数 0

1回答

Flink，setDbStoragePath方法在RocksDBStateBackend中做什么？

我在RocksDBStateBackend中使用flink 1.11，代码如下所示：env.setStateBackend(stateBackend);--我的理解是，当DbStoragePath被设置时，Flink将在存储到hadoop hdfs:///flink-checkpoints之前将所有检查点

浏览 0提问于2021-02-24得票数 0

回答已采纳

1回答

Flink删除花费太长时间的进程，并提交检查点

我正在使用Flink + Kafka来处理流文档。我已经在文档上设置了过滤器来阻止奇怪的文档进入Flink作业，但是仍然有一些类型的文档是我无法预见的。如果作业消耗了这些文档，则需要额外的时间。就像我在任务检查点中看到的那样，许多进程完成得很快，等待缓慢的进程完成(例如，在下面的图像中，除了一个)。我的问题是:我能让Flink在某些阈值之后放弃这些缓慢的进程，并提交那些已经完成的进程吗？我<

浏览 3提问于2022-06-08得票数 0

回答已采纳

1回答

从检查点恢复Apache Flink作业

、、

我正在使用Apache Flink + RabbitMQ堆栈。我知道有机会手动触发保存点并从中恢复作业，但问题是Flink在成功检查点后确认消息，如果您想要设置保存点和恢复状态，您将丢失上次成功的保存点和上次成功的检查点之间的所有数据。有没有办法从检查点恢复作业？这将解决在不可重放数据源(如rabbitmq)的情况下丢失数据的问题。顺便说一句，如果我们有检查点和所有的开销，为什么不让用户使用它们呢？

浏览 20提问于2016-09-13得票数 3

回答已采纳

1回答

重新运行后，闪烁状态为空(已重新初始化)

、、、

我正在尝试连接两个流，第一个是持久化在MapValueState中：RocksDB将数据保存在checkpoint文件夹中，但在新运行后，state为空。我在本地和flink集群中运行它，并在集群中取消提交，然后在本地重新运行 env.setStateBackend(new RocksDBStateBackend(..)

浏览 4提问于2020-05-08得票数 1

回答已采纳

2回答

Flink - AWS上的外部检查点

、、、

我计划使用Analytics上的Flink来执行有状态的流聚合。谢谢!

浏览 7提问于2019-12-31得票数 0

回答已采纳

1回答

Apache Flink中的端到端精确处理一次

、、、

Apache通过从检查点恢复作业来保证在故障和恢复时处理一次，检查点是分布式数据流和操作符状态的一致快照(Chandy-Lamport算法用于分布式快照)。此保证在故障转移时恰好是一次。在正常的集群操作中，Flink如何保证只处理一次，例如给定从外部源读取的Flink源(例如Kafka)，Flink如何保证事件从源读取一次？事件源和Flink源之间是否存在某种类型的应用程序级别？另外，Flink如何保证事件准确地从上游运营商到下游运营商之间只发生一次？对于接收到的事件，

浏览 3提问于2020-09-30得票数 3

回答已采纳

1回答

动态数据分析Flink:不断增加检查点大小

、、

我正在使用AWS (KDA)服务运行Flink应用程序。我的KDA Flink应用程序上一个检查点的大小似乎随着时间的推移而稳步增长。当我将更改推送到应用程序时，您可以在附加的图形中看到检查点大小的突然下降，导致它获取快照、更新，然后从快照恢复。我担心的是，一旦应用程序不再被积极开发，更改就不会像以前那样定期部署，检查点的大小最终可能会增长到太大。有人知道是什么导致检查点的大小不断增长吗？我正在对

浏览 1提问于2020-09-21得票数 4

2回答

有趣的Flink问题--如果任务管理器失败了，那么如何恢复Flink中的状态以保证只处理一次？

、、、

嗨，我是Flink的新手，并试图用下面的场景找出一些最佳实践：这将导致输出Kafka主题中的重复消息。我怎么才能阻止这一切？我<e

浏览 3提问于2022-09-19得票数 0

1回答

没有启用检查点的数据接收器的Flink管道

、

我正在研究如何构建一个没有数据接收器的flink管道。也就是说，我的管道在成功调用数据存储的api时结束。在这种情况下，如果我们不使用接收器操作符，检查点如何工作？因为检查点是基于检查点前时期(持久存在于状态中或发出到接收器中的所有事件)和检查点后时期的概念。flink管道是否需要接收器？

浏览 2提问于2021-06-09得票数 2

2回答

Flink Kinesis使用者未存储上次成功处理的序列号

、、

我们正在使用Flink Kinesis Consumer将Kinesis流中的数据消费到我们的Flink应用程序中。 KCL库使用DynamoDB表来存储最后成功处理的Kinesis流序列号。但是，Flink Kinesis Consumer似乎没有维护任何这样的序列号。在任何持久化存储中。因此，我们需要依靠ShardIteratortype (trim_horizen、latest等)来决定在应用程序重启时从哪里恢复Flink应用程序处理。一种可能的解决方案是依赖于Flink检

浏览 16提问于2019-02-22得票数 3

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云