从保存点恢复时，避免在Apache Flink作业中运行初始化代码

apache-flink、flink-streaming

我有一个Flink作业，其中我正在读取文件夹中的文件，并将其转储到数据库中。每天都会有新文件进入该文件夹。我已经启用了检查点，以便如果由于任何原因Flink作业停止并且我需要重新启动，Flink作业不应该读取已经读取的文件。我在代码中添加了以下代码行，但当我重新启动作业时，Flink作业再次读取所有文件。 env.setStateBackend(new FsStateBackend("file:///C://Users//folder")); env.enableCheckpointing(10L);

浏览 44提问于2019-01-23得票数 5

2回答

如何知道作业是否从保存点恢复？

apache-flink

在Apache Flink中定义和执行我的流处理器的作业图之前，我想运行一些初始化代码，例如，用于创建Kafka主题，我将其用作作业图中的接收器。然而，当流处理器从保存点恢复时，例如在对流处理器的更新期间，该初始化代码不应在其上运行。有没有办法以编程方式检查作业是否从保存点启动？

浏览 5提问于2020-05-19得票数 1

1回答

当从1.10升级到1.11时，无法从保存点恢复Flink键状态后端

migration、apache-flink、flink-streaming

我们试图迁移到Flink 1.11，从1.10中的保存点恢复作业。作业代码没有更改，只将依赖项的Flink版本更新为1.11 (在SBT中，我们使用Scala)并重新构建jar。所有运算符都有uids，如果在1.10集群上运行，作业将正确地从该保存点恢复，我们将得到以下异常，并且不知道： java.lang.Exception: Exception while creating StreamOperatorStateContext. at org.apache.flink.streaming.api.operators.StreamTaskStateInitializerImpl.st

浏览 8提问于2020-09-08得票数 0

3回答

关于Flink外部化检查点的两个问题

apache-flink

我有两个关于Flink外部化检查点的问题 (Q1)我可以在flink-conf.yaml中设置"state.checkpoints.dir“来让外部化的检查点正常工作，但是当我从集成开发环境运行flink时，我如何实现同样的事情呢？我尝试了()中提到的GlobalConfiguration方法，但没有成功。我是这样做的： Configuration cfg = GlobalConfiguration.loadConfiguration(); cfg.setString("state.checkpoints.dir", "file:

浏览 0提问于2018-04-08得票数 5

2回答

无法将保存点从1.2.1还原为1.4

apache-flink、flink-streaming

我们已经用1.4版本部署了一个新的Flink实例。在尝试从旧的1.2.1部署恢复保存点时，尝试还原的所有作业都会出现相同的错误： org.apache.flink.runtime.execution.SuppressRestartsException: Unrecoverable failure. This suppresses job restarts. Please check the stack trace for the root cause. at org.apache.flink.runtime.jobmanager.JobManager$$anonfun$org$apac

浏览 6提问于2018-01-04得票数 2

回答已采纳

1回答

Flink作业群集Kubernetes从保存点恢复

apache-flink、flink-streaming

我们目前在kubernetes上以作业集群的形式运行flink，使用的是helm模板：https://github.com/docker-flink/examples/tree/master/helm/flink (添加了一些配置)。如果我想关闭集群，重新部署一个新的映像(由于应用程序代码更新)，然后重新启动，我该如何从保存点恢复？ jobmanager命令是在standalone-job.sh命令上严格设置的，如果我在部署k8s资源的参数中添加了一个保存点，那么如果flink重新启动(由于某些系统错误)，它将始终从该保存点重新启动，这不是我们想要的。有没有一种方法可以从最新的保存点恢复

浏览 17提问于2020-06-11得票数 0

1回答

如何使用AWS EMR上的Apache Flink安全地更新正在运行的作业？

apache-flink、amazon-emr、flink-streaming

我找不到关于如何安全更新代码的说明。我看到了有关如何使用保存点的Flink文档。我希望有一个简单的解决方案来更新AWS EMR中的Flink作业。 https://ci.apache.org/projects/flink/flink-docs-release-1.9/ops/deployment/aws.html https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/upgrading.html https://ci.apache.org/projects/flink/flink-docs-stable/ops/st

浏览 28提问于2020-06-11得票数 1

1回答

Flink卡夫卡水槽org.apache.kafka.common.errors.UnsupportedVersionException误差

apache-kafka、apache-flink、flink-streaming

版本flink(1.11.3)，kafka(2.1.1) 我的flink数据芹菜是卡夫卡(来源) -> flink ->卡夫卡(接收器)。当我第一次提交工作时，效果很好。但是，在作业经理或任务经理失败后，如果重新启动，则会出现异常。 o.apache.flink.streaming.connectors.kafka.FlinkKafkaProducer 2020-12-31 10:35:35:23.831 objectOperator -> Sink: objectSink (1/1)警告 -遇到错误org.apache.kafka.common.errors.Invali

浏览 5提问于2020-12-30得票数 1

2回答

代码更改后从状态恢复Flink作业

apache-flink

我正在对FS使用Apache Flink 1.9和standart检查点/保存点机制。我的问题是:如果作业的代码发生更改，从保存点恢复作业的正确方法是什么？例如，在重构之后，我重命名了几个类，之后我不能从旧的检查点恢复。我丢失了我的数据，并想问一下-在这种情况下我能做什么？所有运算符都有uid和名称

浏览 0提问于2019-11-26得票数 1

1回答

作业重新启动/取消后恢复MapState

apache-flink

我必须聚合不同实体的事件流的计数/总和。从kafka接收事件日志( json _ str)，并填充映射实体名作为键，值是选择性属性的计数作为json_ str。 MapState sourceAggregationMap = getRuntimeContext().getMapState(sourceAggregationDesc)；对于每个事件流，重新填充值。问题是，每当作业停止(失败)/cancelled时，当作业重新启动时，映射状态不会重新初始化/恢复。计数再次从0开始。使用Apache flink 1.6.0 state.backend: rocksdb

浏览 25提问于2019-01-11得票数 1

回答已采纳

1回答

更新keyBy()中指定的键

apache-flink、flink-streaming

我有一个在生产环境中运行的Flink流作业，我需要对主转换代码进行更改。生产中的代码实际上如下所示： stream .filter(inboundData -> inboundData.hasToBeFiltered()) .uid("filtered-data") .keyBy(data -> data.getMyStringKey()) .process(doSomething()) .uid("processed-inbound-data-id"); 我需要改变keyBy()操作符使用inboundData PO

浏览 0提问于2019-08-08得票数 1

1回答

提交Yarn集群上的Flink作业以从其最后一个保存点恢复其状态

hadoop-yarn、apache-flink、flink-streaming、flink-sql

我正在Yarn集群中运行这些Flink作业。如何使用此保存点重新启动Flink作业。我使用的是Flink 1.4.2。

浏览 1提问于2018-06-01得票数 0

1回答

Flink作业不能在批处理作业中使用保存点

scala、apache-flink、flink-streaming、flink-batch

让我以一种通用的方式开始，看看我是否错过了一些概念:我有一个流flink作业，我从该作业创建了一个保存点。此作业的简化版本如下所示 Pseduo-代码： val flink = StreamExecutionEnvironment.getExecutionEnvironment val stream = if (batchMode) { flink.readFile(path) } else { flink.addKafkaSource(topicName) } stream.keyBy(key) stream.process(new ProcessorWithKeyedStat

浏览 51提问于2021-08-03得票数 0

回答已采纳

1回答

在执行纱线应用程序杀死并再次运行后，flink是否会从上一次偏移恢复？

apache-kafka、apache-flink、checkpoint

我使用FlinkKafkaConsumer来使用kafka并启用检查点。现在，我对偏移管理和检查点机制有点困惑。我已经知道flink将开始从使用者组的. https://ci.apache.org/projects/flink/flink-docs-stable/dev/connectors/kafka.html#kafka-consumers-start-position-configuration读取分区，并且偏移量将存储到远程fileSystem中的检查点中。https://ci.apache.org/projects/flink/flink-docs-stable/dev/connec

浏览 6提问于2019-11-04得票数 2

回答已采纳

1回答

从检查点恢复Apache Flink作业

rabbitmq、apache-flink、flink-streaming

我正在使用Apache Flink + RabbitMQ堆栈。我知道有机会手动触发保存点并从中恢复作业，但问题是Flink在成功检查点后确认消息，如果您想要设置保存点和恢复状态，您将丢失上次成功的保存点和上次成功的检查点之间的所有数据。有没有办法从检查点恢复作业？这将解决在不可重放数据源(如rabbitmq)的情况下丢失数据的问题。顺便说一句，如果我们有检查点和所有的开销，为什么不让用户使用它们呢？

浏览 20提问于2016-09-13得票数 3

回答已采纳

1回答

Apache在作业部署期间重复消息处理，并以ActiveMQ为源

kubernetes、apache-flink、flink-streaming、flink-cep、flink-sql

Given，我有一个Flink作业，它从ActiveMQ源代码读取&写到mysql数据库，键控在标识符上。我每隔一秒就为这项工作启用检查点。我将检查点指向一个Minio实例，验证检查点是否与jobid一起工作。我部署这个任务是一个Openshift (在下面的Kubernetes)--我可以在需要的情况下扩大/减少这个任务。问题在部署(滚动)作业或由于错误/错误导致作业下降时，如果ActiveMQ中有未使用的消息或Flink中的未确认消息(但写入数据库)，则当作业恢复(或部署新作业)时，作业处理已经处理消息，从而导致在数据库中插入重复的记录。问题检查点不应该帮助工作从原来

浏览 1提问于2020-03-05得票数 1

2回答

Apache Flink -运行重复作业时检查点/保存点的工作方式(多租户)

apache-flink、flink-streaming、flink-cep、flink-sql、flink-batch

我有多个Kafka主题(多租户)，并且我根据主题的数量多次运行相同的作业，每个作业消耗来自一个主题的消息。我已经将文件系统配置为状态后端。假设有3个作业在运行。检查点在这里是如何工作的？这3个作业是否都将检查点信息存储在同一路径中？如果任何作业失败，该作业如何知道从何处恢复检查点信息？我们过去常常在向flink群集提交作业时提供作业名称。这跟它有什么关系吗？一般而言，Flink如何区分作业及其检查点信息，以便在作业出现故障或手动重新启动作业时进行恢复(无论作业相同还是不同)？ Case1:如果作业失败，会发生什么情况？ Case2:如果我们手动重新启动作业会发生什么？谢谢

浏览 33提问于2020-07-16得票数 0

回答已采纳

1回答

从外部化检查点问题恢复Flink

docker、apache-flink、amazon-ecs

我使用的是在从docker-flink安装的ECS中运行的Flink。我已经通过flink-conf.yaml中的state.checkpoints.dir到S3启用了外部检查点到AWS S3。现在，根据Flink文档here，如果我们想在出现故障的情况下从检查点恢复，我们必须使用bin/flink run -s :checkpointMetaDataPath [:runArgs]，但我使用FLINK_HOME/bin standalone-job.sh start-foreground。所以我不能弄清楚我的Flink作业在失败的情况下如何从外部化的检查点恢复。我们真的需要一些从检查点恢

浏览 35提问于2020-04-03得票数 0

回答已采纳

1回答

Apache flink:从RocksDB后端的存储点延迟加载

apache-flink、flink-streaming、rocksdb

我们希望使用带有RocksDB后端(HDFS)的Apache Flink来进行有状态流处理。但是，我们的应用程序状态(键控状态)将是of级的。据我所知，当我们从保存点恢复作业时，所有操作员状态数据都将从HDFS上的保存点位置发送到每个任务管理器。如果状态是to级的，那么如果所有这些状态都需要传输，那么每次部署都将导致非常长的停机时间。我想知道，在RocksDB的情况下，是否可以配置延迟加载，其中键控状态在需要时从HDFS中检索，然后缓存到本地磁盘上。谢谢!

浏览 29提问于2020-04-23得票数 0

1回答

无法获取检查点以在Flink中加载

apache-flink、flink-streaming

我希望在Flink中加载最新的检查点，但它不是。我已经编写了一个字数统计应用程序，它的目的是在重启后重新开始计数。我从我的IDE运行它，所以我不会启动一个Flink集群。这是我写的https://github.com/edu05/wordcount/tree/simple代码，它的灵感来自于Flink创建者提供的检查点示例……https://github.com/streaming-with-flink/examples-scala 我遗漏了什么？我怎样才能避免重新打印一些字数？我在Apache Flink上的Stackoverflow中看不到很多贡献者，有没有其他更合适的论坛？

浏览 15提问于2019-05-31得票数 0

1回答

Flink:无法在另一台机器中生成HDFS保存点

hdfs、apache-flink、flink-streaming

我正在尝试用HDFS中的Apache 1.2创建一个保存点。我在我的机器上的本地集群中运行Flink。HDFS正在虚拟机中运行。我设法在Flink流作业中写入HDFS，但保存点不会这样做。我的保存点路径是hdfs://hadoop:54310/savepoint/testpoint，在提交任务之前，我在UI中指定了它。它提供了以下错误消息：(无效路径) org.apache.flink.client.program.ProgramInvocationException: Failed to submit the job to the job manager at org.apache

浏览 1提问于2017-05-29得票数 1

回答已采纳

1回答

Flink职务群集与会话群集-部署和配置

java、docker、deployment、apache-flink、flink-streaming

我正在研究Flink 1.9.1的停靠/K8部署的可能性。我正在读/看13。目前，我们确实认为我们将尝试采用工作集群的方法，尽管我们想知道这个社区的趋势是什么？我们不希望每个Flink集群部署一个以上的作业。总之，我想知道几件事：如何更改职务和会话群集每个任务管理器的任务槽数？在我的例子中，我在VirtualBox上运行docker，其中我为这台机器分配了4个CPU。但是，每个任务管理器只生成一个用于“职务群集”的任务槽。但是，对于会话群集，在同一台机器上，每个任务管理器都生成4个任务槽。在这两种情况下，Flink的UI显示每个任务管理器都有4个CPU。如果使用职务群集，如

浏览 1提问于2020-01-10得票数 2

回答已采纳

1回答

如何在Apache Flink集群运行时添加新的工作节点

cluster-computing、apache-flink、flink-streaming

我想要设置具有多台机器的apache Flink集群，并且只想知道我的Flink集群是否已启动并正在运行，并且在运行时我想添加新的工作节点以加快计算工作。我怎么能做到这一点？

浏览 63提问于2019-06-27得票数 0

1回答

如何使用闪烁计数窗口

java、apache-flink

当我在windowfunction之前使用countwindow时，在运行代码后我得到了类似State migration is currently not supported的错误，详细消息是 org.apache.flink.util.FlinkRuntimeException: org.apache.flink.util.StateMigrationException: State migration is currently not supported. at org.apache.flink.runtime.state.heap.HeapKeyedStateBackend.c

浏览 17提问于2020-02-11得票数 0

1回答

是否可以在Flink流期间删除插槽时进行恢复

apache-flink、flink-streaming

我有一个独立的集群，其中有一个具有1小时事件时间窗口的Flink流作业。运行2-3小时后，作业终止，并出现"org.apache.flink.util.FlinkException:分配的插槽...已删除“异常。当我的窗口只有15分钟时，这项工作运行得很好。丢失插槽后，作业如何恢复？是否可以在多个插槽上运行相同的计算以防止此错误？我应该增加任何超时时间吗？如果是这样，是哪一个？

浏览 4提问于2019-12-09得票数 0

1回答

重新启动后，Flink任务管理器不处理数据。

apache-flink、flink-streaming、flink-cep

我是flink的新手，我部署了我的flink应用程序，它基本上执行简单的模式匹配。它部署在库伯奈特斯集群，拥有1 JM和6 TM。我每10分钟发送一次4.4k和200k大小的消息，并执行负载测试。我添加了重新启动策略和检查指向，如下所示，我没有显式地使用代码中的任何状态，因为不需要它。 StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); // start a checkpoint every 1000 ms env.enableCheckpointing(inter

浏览 4提问于2020-12-04得票数 0

2回答

flink什么时候开始删除RocksDBKeyedStateBackend目录？

apache-flink、flink-streaming

我的Flink作业运行了几天，没有任何问题，但是过了几天，就会关闭tm并重新启动整个作业。在日志中我发现，org.apache.flink.contrib.streaming.state.RocksDBKeyedStateBackend -删除现有的实例基目录/tmp/flink-io-4b455efa-bcde-4ef2-aed3-c66ca9d8933e/job_152b986e7e5a6f411780849f13ce4bc8_op_KeyedProcessOperator_a1c286a47e97622aa92a8f6cd4115854__1_4__uuid_4b53ff24-e240-

浏览 5提问于2020-10-06得票数 0

回答已采纳

1回答

在生产中更新flink keyby函数

java、deployment、streaming、apache-flink、flink-streaming

我试图在我的产品flink作业中更新keyby函数，方法是向getKey函数添加一个新的keyby值，例如keyby函数是 return Tuple2.of( value.getTimestamp(), value.isDefault() 而现在却是 return Tuple3.of( value.getTimestamp(), value.isDefault(), value.isRedirect() ) 我正试图将新任务部署到uat服务器(以确保它在启动之前工作)，方法是优雅地停止作业并使用保存点进行恢复，但是

浏览 0提问于2021-06-16得票数 0

1回答

apache-flink

我有一个Apache Flink Job，是用DataStream API实现的，它包含一些在定义和提交作业图之前的初始化代码。初始化代码应仅在首次提交作业时运行，而不应在从检查点恢复作业或使用保存点更新作业时运行。在从检查点进行故障转移期间重新启动作业时，作业似乎是从存储在检查点中的作业图重新启动的-特别是，初始化代码不会再次运行(这正是我想要的)。从保存点运行作业时是否也可能出现这种情况？换句话说，是否有一种方法可以仅在作业不是从保存点启动时才执行代码？

浏览 11提问于2020-04-06得票数 0

1回答

Flink JobManager因检查点故障而停止工作

apache-flink

我最近将我们的Flink从1.9.0迁移到了没有HA作业集群的1.11.1。我面临以下错误，它导致JobManager在每隔5分钟后失败，并且Flink作业通过AWS ECS卡在这些重新启动循环中。在升级1.11.1后，它曾经在Flink 1.9.0中工作过，但现在不行了。因为我没有JM，所以我为每个flink作业生成固定的--job-id，而不是默认的id 00000000000。我是Flink的新手。 org.apache.flink.runtime.checkpoint.CheckpointException: Could not finalize the pending check

浏览 195提问于2020-12-04得票数 0

1回答

flink是否支持暂停flink作业？

apache-flink、flink-streaming

我刚刚开始学习apache，并遇到了一个问题:我怎样才能暂停flink工作，然后继续它呢？flink支持使用命令行挂起作业吗？

浏览 3提问于2017-06-13得票数 1

1回答

无法运行反序列化来自kafka主题的avro数据的flink应用程序

java、apache-kafka、apache-flink、avro

尝试使用flink应用程序从kafka主题读取avro数据。在运行flink应用程序时获得以下错误。这是我第一次与flink/kafka合作，几天来无法解决这个问题。 org.apache.flink.runtime.client.JobInitializationException：无法启动JobMaster。在org.apache.flink.runtime.jobmaster.DefaultJobMasterServiceProcess.lambda$new$0(DefaultJobMasterServiceProcess.java:97) at java.util.concurrent

浏览 8提问于2022-03-24得票数 0

1回答

Flink流文件接收器无法从故障中恢复

amazon-s3、apache-flink

我们有一个flink流作业，它读取卡夫卡的数据并将其汇到S3。我们使用flink的内部流文件接收器API来实现这一点。然而，几天后，作业失败了，无法从失败中恢复。消息说它无法从找到文件。我们想知道可能的根本原因是什么，因为我们真的不想丢失任何数据。谢谢。整个输出如下所示 java.io.FileNotFoundException: No such file or directory: s3://bucket_name/_part-0-282_tmp_b9777494-d73b-4141-a4cf-b8912019160e at org.apache.flink.fs.shaded.

浏览 1提问于2019-11-27得票数 1

1回答

flink:作业不会在较高的taskmanager.heap.mb下运行

java、apache-flink

简单工作：kafka->flatmap->reduce->map。作业运行正常，默认值为taskmanager.heap.mb (512 Job )。根据：this value should be as large as possible的说法。由于所讨论的机器有96 of内存，所以我将其设置为75000 (任意值)。开始作业会产生以下错误： Caused by: org.apache.flink.runtime.client.JobExecutionException: Job execution failed. at org.apache.flink.runti

浏览 4提问于2015-11-09得票数 2

回答已采纳

1回答

在K8S上为更新策略执行rollingUpdate时，Flink的恢复机制是什么？

apache-flink、flink-streaming

我想知道在k8s上滚动更新重新启动作业时，Flink中的检查点或保存点的恢复过程。下面让我解释一下简单的例子。假设我在我的flink k8s作业中有4个荚，并且使用parallelism 1有以下简单的数据流。 source -> filter -> map -> sink 每个吊舱负责每个操作员，数据通过源函数消耗。因为我不想丢失数据，所以我在Flink中将数据流设置为at least或exactly at once模式。然后，当滚动更新发生时，每个吊舱都会按顺序重新启动。假设过滤器由pod1管理，map为pod2，接收器为pod3，源分别为pod4。当根据滚动更新重新启

浏览 3提问于2022-10-13得票数 0

回答已采纳

1回答

在执行流之前，有没有办法通过编程检查Flink流作业是否从保存点启动？

apache-flink、flink-streaming

在StreamExecutionEnvironment上调用execute并启动流作业之前，有没有一种方法可以通过编程来确定作业是否从保存点恢复？我需要知道这样的信息，这样我才能在构建作业图时根据它设置Kafka源的偏移量。看起来拥有initializeState方法的FlinkConnectorKafkaBase类可以访问这样的信息(code)。但是，没有办法截取FunctionInitializationContext并检索isRestored()值，因为initializeState是一个final方法。此外，initializeState方法是在执行作业图之后调用的，因此我认为没有

浏览 37提问于2019-10-12得票数 1

回答已采纳

1回答

升级Apache需要更新pom.xml吗？

apache-flink

我刚刚将我的flink从1.9.1升级到1.11.2 (使用docker) --当我尝试升级到1.11.1并重新运行我的作业时，已经有许多flink作业在1.9.1版本中运行，它会显示错误。 2020-11-12 06:49:17,731 WARN org.apache.zookeeper.ClientCnxn [] - SASL configuration failed: javax.security.auth.login.LoginException: No JAAS configuration section named &

浏览 5提问于2020-11-11得票数 0

回答已采纳

1回答

如何在Flink中实现自动故障切换

apache-flink

我在一个由3台机器组成的集群上使用Apache 1.4，其中一台是JobManager，另外2台是主机TaskManagers。我在集群模式下启动flink并提交flink作业。我已经在flink配置中配置了24个任务槽，对于该任务，我使用了6个任务插槽。在代码中，我启用了检查点，并将重新启动策略设置为fixedDelayRestart。当我提交作业时，我看到3个任务被分配给工人机器1，3个任务分配给工作机器2。现在，当我在WorkerMachine 2上杀死WorkerMachine 2时，我看到整个作业失败了。这是预期的行为，还是有自动故障转移，如星火。我们是否需要使用纱线

浏览 4提问于2018-01-15得票数 2

2回答

Flink Kinesis使用者未存储上次成功处理的序列号

apache-flink、flink-streaming、amazon-kinesis

我们正在使用Flink Kinesis Consumer将Kinesis流中的数据消费到我们的Flink应用程序中。 KCL库使用DynamoDB表来存储最后成功处理的Kinesis流序列号。因此，下次应用程序启动时，它将从中断的位置恢复。但是，Flink Kinesis Consumer似乎没有维护任何这样的序列号。在任何持久化存储中。因此，我们需要依靠ShardIteratortype (trim_horizen、latest等)来决定在应用程序重启时从哪里恢复Flink应用程序处理。一种可能的解决方案是依赖于Flink检查点机制，但只有当应用程序在失败后恢复时才起作用，而不是当应用

浏览 16提问于2019-02-22得票数 3

1回答

很少有kafka分区没有分配给任何flink使用者

java、apache-kafka、apache-flink

我有一个kafka主题，有15个分区0-14，我正在运行5个并行的flink。因此，理想情况下，每个并行flink使用者应该分别使用3个分区。但是，即使在多次重启之后，很少有kafka分区不是由任何flink工作者订阅的。 org.apache.kafka.clients.consumer.KafkaConsumer assign Subscribed to partition(s): topic_name-13, topic_name-8, topic_name-9 org.apache.kafka.clients.consumer.KafkaConsumer assign Subsc

浏览 10提问于2020-09-08得票数 1

回答已采纳

1回答

Apache Flink如何从检查点/保存点恢复状态？

apache-flink、stream-processing

我需要知道Apache Flink如何从检查点恢复其状态，因为在运行纯作业时，我看不出启动时间和在operator中看到第一个事件与从保存点恢复相比有什么不同。状态是否从检查点/保存点延迟加载？

浏览 4提问于2018-02-01得票数 0

1回答

在EMR上运行带有flink纱线会话的束流管道

apache-flink、hadoop-yarn、apache-beam、amazon-emr

我正在尝试从python SDK运行一个基本的字数束管道，并在AWS EMR上使用flink yarn会话。我同时使用了flink runner和便携runner，得到了下面列出的两个不同的错误。这两种类型的运行器的作业都会显示在flink UI中，并在我的笔记本电脑上使用本地flink会话成功运行。使用FlinkRunner时，作业以BeamApp-hadoop-0617202523-14894e58的身份运行，并显示错误： ERROR:root:java.lang.NoClassDefFoundError: Could not initialize class org.apache.b

浏览 17提问于2020-06-18得票数 2

回答已采纳

1回答

尝试为检查点作业启动flink作业主机时超时

kubernetes、apache-flink、flink-streaming、high-availability

我正在尝试将flink设置为从检查点恢复。在大多数情况下，这似乎是有效的，然而，在将其部署到我们的分段环境大约一周后，作业管理器已经开始崩溃循环，因为在尝试启动作业的“作业主机”时超时。我使用在高可用性模式下部署的flink 1.7.2和zookeeper 3.4.9-1757313，只是为了方便检查点恢复。我在kubernetes上只部署了一个作业管理器作为有状态集。一定是什么原因导致服务器崩溃，并且在重新启动时，启动(可能)恢复的作业的作业主机的代码似乎失败。我以前见过一次，清除所有的flink zookeeper条目( zk中的rmr /flink)，然后重新启动flink集群“修

浏览 57提问于2019-06-19得票数 1

1回答

纱线接头作业Flink检查点的路径动态设置

apache-flink、flink-streaming、flink-sql

我使用Yarn来运行Flink作业。对于每个Flink作业，我都要创建一个检查点。我提交一个在我的Yarn集群中运行的Flink作业。我有一个轮询作业，它检查一个作业是否在Yarn上失败并重新启动它。当作业再次提交时，Yarn为该Flink作业创建一个新的application_id。如何配置重新提交的Flink作业以使用重新启动的Flink作业的检查点。我已将conf state.savepoints.dir = hdfs://localhost:9000/checkpoint/设为flink-conf. have‘ 创建Flink作业时，streamExecutionEnvironme

浏览 0提问于2018-05-22得票数 0

回答已采纳

2回答

重新启动时的Kafka & Flink重复消息

duplicates、apache-kafka、apache-flink、flink-streaming

首先，这与非常相似，但并不相同。这个问题的答案似乎解决不了我的问题。如果我在答案中遗漏了什么，那么请重新表述答案，因为我显然遗漏了一些东西。问题是完全一样的，尽管-- Flink (卡夫卡连接器)重新运行它在关闭之前看到的最后3-9条消息。我的版本 Flink 1.1.2 Kafka 0.9.0.1 Scala 2.11.7 Java 1.8.0_91 我的密码 import java.util.Properties import org.apache.flink.streaming.api.windowing.time.Time import org.apache.flink.strea

浏览 4提问于2016-09-12得票数 7

回答已采纳

2回答

使用单个JobManager进行恢复

apache-flink

我正在尝试恢复作业，并在作业管理器关闭而我无法成功重新启动作业时进行状态。根据我的理解，TaskManager恢复是由JobManager辅助的(这是预期的)，而JobManager恢复是通过Zookeeper完成的。我想知道是否有一种方法可以在没有zookeeper的情况下恢复作业管理器？我使用docker进行设置，所有检查点和保存点都保存到映射的卷中。当所有作业管理器都宕机时，flink是否能够恢复？我可以等待单个JobManager重新启动。当我重新启动作业管理器时，我得到了以下异常：org.apache.flink.runtime.rest.NotFoundException

浏览 16提问于2018-09-07得票数 1

回答已采纳

1回答

在Kubernetes中扩展Apache Flink

kubernetes、apache-flink

我的Flink流媒体工作在当地的Kubernetes中启动和运行。作业从Kafka主题中读取，对其进行一些(无状态)计算，并将其写回另一个Kafka主题。作业的检查点保存在S3中。Flink的命令行工具在单荚(副本)中部署作业，那么如何增加副本以并行地增加对数据的操作&作业的吞吐量？

浏览 21提问于2022-08-01得票数 0

2回答

StreamingFileSink的用法是抛出NoClassDefFoundError

java、hadoop-yarn、apache-flink、amazon-emr

我知道这可能是我的问题，但试着解决一段时间。我正在尝试在AWS EMR群集中运行flink。我的设置是:来自Kinesis的时序事件-> flink作业->将其保存到S3 DataStream<Event> kinesis = env.addSource(new FlinkKinesisConsumer< (this.streamName, new EventSchema(), kinesisConsumerConfig)).name("source"); final StreamingFileS

浏览 20提问于2019-05-06得票数 1

2回答

Flink -如何解决错误这个工作是不可停止的。

apache-flink、flink-streaming

我试图通过flink停止停止一项工作 flink stop [jobid] 但是，CLI引发错误，不允许我停止作业。我可以取消它。这里的原因是什么？停止工作c7196bb1d21d679efed73770a4e4f9ed。程序在以下异常情况下结束： org.apache.flink.util.FlinkException: c7196bb1d21d679efed73770a4e4f9ed无法停止这项工作。在org.apache.flink.client.cli.CliFrontend.lambda$stop$5(CliFrontend.java:557) at org.apache.fl

浏览 1提问于2018-12-12得票数 0

回答已采纳

1回答

Apache自定义java选项在作业内部不被识别。

java、apache-flink、flink-streaming

我在flink- line .line中添加了以下一行： env.java.opts：“-Ddy.pros.path=/PATH/TO/PROPS/FILE” 在启动作业管理器(jobmanager.sh启动集群)时，我在日志中看到确实识别了jvm选项。 2017-02-20 12:19:23,536 INFO org.apache.flink.runtime.jobmanager.JobManager - JVM Options: 2017-02-20 12:19:23,536 INFO org.apache.flink.runtime.jobmanage

浏览 6提问于2017-02-20得票数 8

回答已采纳