Jobmanager重启后Flink无法从checkpoint恢复

问题描述 投票:0回答:1

我正在 Docker-compose 上运行 flink 集群,其中包含 1 个作业管理器和 1 个任务管理器。我通过重启Jobmanager的容器来测试checkpoint的机制。但我发现状态没有正常恢复。另一方面,当我重新启动 TaskManager 的容器时,它工作得很好。 这是设计造成的吗?当 JobManager 重新启动时,如何从检查点恢复作业?

apache-flink flink-streaming
1个回答
0
投票

Flink 要求您配置高可用性以便从作业管理器故障中恢复。如何进行此操作的详细信息取决于集群的部署方式:您可以设置 Zookeeper 来管理此操作,也可以依赖 Kubernetes。有关详细信息,请参阅 https://nightlies.apache.org/flink/flink-docs-stable/docs/deployment/ha/overview/

© www.soinside.com 2019 - 2024. All rights reserved.