监控是指查看绩效,监督和监督的流程或系统的行为。
Percona Mongodb Exporter 的自定义端口
如何从同一台 ec2 机器监控多个 mongodb 集群?我想访问多个 mongo db URI 并抓取它们的指标。我正在考虑的一个解决方案是在 diff 处启动 mongodb 导出器...
Cloud SQL 的 Query Insights 'UTILITY COMMAND' 成本
Postgres 12.8 集群(1 个写入器,1 个读取器)托管在 GCP 上。 每当我“在 READER 实例上”出现 CPU 峰值并深入“查询见解”进行昂贵的查询时,每次最昂贵的操作都是 UTI...
为什么 Relabelings 无法从服务发现标签中删除某些标签?
我在 EKS 集群中有一个 kube-prometheus-stack 设置,其中有一个 ServiceMonitor,其目标是开箱即用的 kube-state-metrics 的端点。服务发现有这些目标实验室...
在 MarkLogic 监控仪表板上,可用空间显示为已满。根据 MarkLogic 文档,这是指在考虑了
使用 Grafana / Prometheus / Tempo 检索 HTTP 请求统计信息
我正在尝试监视部署在多个 Kubernetes 部署上的 java 应用程序。 到目前为止我已经成功发货 使用 Promtail 记录到 Loki 使用运算符向 Prometheus 提供 Kubernetes 指标
我正在尝试使用 promethus 导出器监控 solr ./bin/solr-exporter -p 9309 -b http://localhost:8309/solr -f ./conf/solr-exporter-config.xml 在启用基本功能之前它工作正常
我想设置来自alertmanager的警报通知,以便我收到: 立即松弛通知 如果给定警报触发至少 1 小时,OpsGenie 会发出通知 电子邮件
目标: 我正在尝试为所有目标(服务器)创建一个集中仪表板,以监控它们的健康状况并显示在我们办公室的大屏幕上。 我尝试过的: 1-创建了一个变量 Ins...
Prometheus 抓取间隔导致 Metrics 监控存在时间差异
时间是我们业务的重要组成部分,因此我必须对服务器的时间进行强有力的监控。为此,我在我们的服务器中设置了普罗米修斯节点导出器来获取服务...
如何填充过去的值以包含偏移量的单元测试 Prometheus 警报?
我正在尝试测试 Prometheus 警报的记录规则。 这按预期工作: # 测试文件.yaml 规则文件: -“../records.yaml” 评估间隔:1m 组评估顺序: - 重新...
我有一个AWS Lambda python应用程序,我们称其为A。它调用多个服务,我们称其中之一为B。我想知道如何在CloudWatch中监控A和B之间的连接,即:
错误:无法与 Loki 连接。请检查服务器日志以获取有关 Grafana 的更多详细信息
我已经在我的 Ubuntu 服务器上安装了 Loki,并在另一台服务器上配置了 Promtail 来抓取日志。 Grafana 也在设置 Loki 的服务器上。当我尝试选择洛基时,问题就出现了......
使用 zabbix 进行 Windows Active Directory 监控
我想使用 Zabbix 监控我的 Windows Active Directory,并希望收集用户、会话、日志等数据。 我怎样才能做到这一点,因为我找不到任何支持文件
我有一个基于Php和Fat-Free Framework的php应用程序(还在前端使用mysql,influxDb,vue js)。我希望能够检查哪些端点被使用、由哪些用户使用以及基于...
将 EMR 上 Pyspark 作业的峰值内存利用率写入文件
我们在 EMR 上运行大量 Pyspark 作业。执行的管道是相同的,但输入可以极大地改变峰值内存利用率,并且该利用率随着时间的推移而增长。我愿意
错误:telegraf.service 作业失败,因为控制进程退出并显示错误代码
我已经在我的 Ubuntu 实例上安装了 InfluxDB。之后,我安装了 Telegraf。但是当我检查 Telegraf 的状态时,它说:无法启动 Telegraf 请参阅下图以获得更好的
我是 AWS 服务的新手,正在尝试自动化我的 AWS 服务运行状况检查。 作为其中的一部分,我希望创建一个报告,显示 ECS 服务下集群的状态及其任务
我想实时分析GCP日志并从中发出警报。因为分析取决于一些聚合和相关性(例如:事件 A 发生距离事件 B 不到 10 分钟,所以......
我正在使用 flexlm_exporter 将许可证使用情况导出到 Prometheus,并从 Prometheus 导出到自定义服务(不是 Grafana)。 如您所知,普罗米修斯隐藏了缺失的值。 然而,我需要那些失踪的人...
我目前正在从事 Confluence 升级项目,并将从 Weblogic 迁移到 Tomcat 6.0。目前整个系统的所有监控均由Netcool完成。有谁知道吗...