Jobmanager重启后Flink无法从checkpoint恢复

问题描述投票：0回答：1

我正在 Docker-compose 上运行 flink 集群，其中包含 1 个作业管理器和 1 个任务管理器。我通过重启Jobmanager的容器来测试checkpoint的机制。但我发现状态没有正常恢复。另一方面，当我重新启动 TaskManager 的容器时，它工作得很好。这是设计造成的吗？当 JobManager 重新启动时，如何从检查点恢复作业？

apache-flink flink-streaming

1个回答

0
投票

Flink 要求您配置高可用性以便从作业管理器故障中恢复。如何进行此操作的详细信息取决于集群的部署方式：您可以设置 Zookeeper 来管理此操作，也可以依赖 Kubernetes。有关详细信息，请参阅 https://nightlies.apache.org/flink/flink-docs-stable/docs/deployment/ha/overview/。

最新问题

无法使用指数 curve_fit 来处理日期
使用 powershell 列出 Azure Sentinel 中的所有自动化规则
turbo-frame src 已更新，但 html 未呈现
尝试上传图像文件时，选择文件按钮没有响应
clickhouse中的动态排序 row_number()
多线程push_back到std::vector：互斥，放大和就地编辑，或者为结果创建一个向量并将其推回？
如何确保 Flask 应用管理面板中的项目具有单击删除功能？
如何访问TNewComboBox类的ItemIndex属性？
Dockerfile - 通过使用 COPY --from
在vb.net中“Await httpClient.GetAsync”不等待响应
将 AWS Lambda 项目从 .NET 6 升级到 .NET 8 后反序列化事件时出错
不同用户中的 Oracle TRUNCATE 表在未指定表的实际用户的情况下无法工作，尽管有授权和公共同义词
如何在 ASP.NET Core 中使控制器具有作用域或单例而不是瞬态？
在flutter中将内存图像（如Uint8list）保存为图像文件
SQL 开发人员查询长时间工作后不再工作
Java 使用 set 中的键初始化映射
Tensorflow：指标尚未构建错误
为什么 Google Kubernetes Engine cilium for anetd 报告错误？
正则表达式查找两个字符串之间的共同字母
捕获组VS非捕获组

Jobmanager重启后Flink无法从checkpoint恢复

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1