Apache Flink 任务管理器自动化

问题描述 投票:0回答:1

目前我有一个非常繁忙的服务器,Flink 正在与其他应用程序争夺资源,这导致 Taskmanager 崩溃并且所有作业都进入 Fail 状态。我通常只是重新启动 Taskmanager.sh 并开始工作,直到它再次崩溃。

我知道解决方案是获取更多资源,而且即将到来,但在那之前,我需要帮助来了解使 Taskmanager.sh 在崩溃时自动重启的最佳方法。

我在网上搜索过,找到了两个选项 1.- 创建一个脚本,然后将其添加到 cronjob。 2.- 将 Taskmanager.sh 复制到 systemd 并编辑文件以在它感觉到它关闭时重新启动它 (https://www.cyberciti.biz/faq/how-to-restart-a-process-out-of-crontab-on-a-linuxunix/)

我以前没有做过脚本,所以在我尝试深入研究它之前,想知道这些选项中的任何一个是否可以使用 Flink 的任务管理器,或者是否有更简单的解决方案?

系统:RHEL

谢谢!

手动重启 Taskmanager.sh 可以工作,但 5 分钟后就崩溃了。

shell apache-flink taskmanager
1个回答
0
投票

标准方法是使用 Kubernetes 或 Yarn 部署 Flink,在这种情况下,这是自动处理的。但是将任务管理器设置为由 systemd 管理的服务应该是可行的。

© www.soinside.com 2019 - 2024. All rights reserved.