如何监视远程进程是否崩溃?

问题描述 投票:0回答:2

我在多个云提供商中拥有大量实例。他们每个人都运行一个Java程序。我想检查所有这些Java程序是否正在运行并且没有崩溃,并且如果/当其中一个崩溃时,我想得到有关它的警报。

目前,我有一个从本地计算机运行的共同解决方案,该解决方案将遍历所有IP地址的数组,并通过SSH发送命令给每个IP地址,以检查ps -ef并计算正在运行的Java进程数。如果该数字为零,那么我将在屏幕上弹出一些警报来提醒我。

有更好的解决方案吗?理想情况下,我可以使用Zabbix样式的工具为我处理它,但是我不知道是否有满足此需求的工具。

amazon-web-services amazon-ec2 ssh monitoring remote-server
2个回答
0
投票

[如果您在云中运行大量应用程序,那么您可能会考虑使用云监视工具,而不是重新发明轮子。我敢肯定,您不仅要监视进程的上/下状态,还需要监视更多。有很多云监控工具,可让您监控平台(机器)和流程。另外,可以根据需要配置不同类型的通知。

我建议您研究云监控解决方案,例如New Relic / Datadog / Pager Duty / etc。如果在商业上可行,那么我强烈建议您使用它们。


0
投票

您可以让所有服务将状态指标写入CloudWatch指标,并在任何状态不报告状态时创建警报。 This example显示了使用CloudWatch指标报告Linux性能计数器。

© www.soinside.com 2019 - 2024. All rights reserved.