我想在 Databricks 中设置集群使用警报。
类似:如果驱动程序节点的 CPU 利用率 > 80%,则发送警报。
可以为作业设置电子邮件通知,但我对特定于集群利用率的警报感兴趣。 我们正在使用工作流程进行结构化流处理,并在工作流程中设置电子邮件通知,但我们希望在集群利用率超过阈值时设置警报。
你可以
通常,您可以将 Spark 指标 发送到您想要的任何监控工具(Grafana、DataDog、Splunk、Azure Monitor...),然后构建警报。您的发送方式取决于使用的工具和其他环境。