我有一个 IaaC 项目,它使用 Terraform 和 Helm 图表来部署 Prometheus(以及 Grafana、Kubernetes 和平台应用程序)。我在 Prometheus 上确实有 Kubernetes 指标。但是,我意识到部署的 Prometheus 上的配置并不是真正来自项目中的 Prometheus 配置文件。我不确定这是 configMap 还是其他配置的问题。以下是项目中涉及的文件:
/terraform/kubernetes/files/prometheus_config_map.yaml
global:
scrape_interval: 15s
scrape_configs:
- job_name: 'prometheus'
static_configs:
- targets: ['localhost:9090']
- job_name: 'kubernetes-pods'
kubernetes_sd_configs:
- role: pod
relabel_configs:
- source_labels: [__meta_kubernetes_pod_annotation_prometheus_io_scrape]
action: keep
regex: true
- source_labels: [__meta_kubernetes_pod_annotation_prometheus_io_path]
action: replace
target_label: __metrics_path__
regex: (.+)
- source_labels: [__address__, __meta_kubernetes_pod_annotation_prometheus_io_port]
action: replace
regex: ([^:]+)(?::\d+)?;(\d+)
replacement: $1:$2
target_label: __address__
- action: labelmap
regex: __meta_kubernetes_pod_label_(.+)
- source_labels: [__meta_kubernetes_namespace]
action: replace
target_label: kubernetes_namespace
- source_labels: [__meta_kubernetes_pod_label_component]
action: replace
target_label: job
- source_labels: [__meta_kubernetes_pod_name]
action: replace
target_label: kubernetes_pod_name
/terraform/kubernetes/prometheus.tf
resource "kubernetes_namespace" "prometheus" {
metadata {
name = "prometheus"
}
}
resource "kubernetes_config_map" "prometheus_config" {
metadata {
name = "prometheus-config"
namespace = "prometheus"
}
data = {
"prometheus.yml" = file("${path.module}/files/prometheus_config_map.yaml")
}
depends_on = [
kubernetes_namespace.prometheus
]
}
# Values documentation: https://github.com/bitnami/charts/blob/master/bitnami/kube-prometheus/values.yaml
resource "helm_release" "prometheus" {
name = "prometheus"
repository = local.helm_repositories.bitnami
chart = "kube-prometheus"
version = "3.4.0"
namespace = "prometheus"
atomic = true
max_history = 5
values = [
file("${path.module}/helm_values/security.yaml.tpl"),
file("${path.module}/helm_values/prometheus.yaml")
]
depends_on = [
kubernetes_config_map.prometheus_config
]
}
/terraform/kubernetes/helm_values/prometheus.yaml
prometheus:
podMetadata:
annotations:
container.apparmor.security.beta.kubernetes.io/prometheus-operator: runtime/default
seccomp.security.alpha.kubernetes.io/pod: runtime/default
nodeAffinityPreset:
## Node affinity type
## Allowed values: soft, hard
##
type: "hard"
## Node label key to match
## E.g.
## key: "kubernetes.io/e2e-az-name"
##
key: "cloud.google.com/gke-nodepool"
## Node label values to match
## E.g.
## values:
## - e2e-az1
## - e2e-az2
##
values: [
"project-primary-pool"
]
prometheus:
configMaps:
- prometheus-config
在这个文件
/terraform/kubernetes/helm_values/prometheus.yaml
中,我试图删除最后一个prometheus:
并根据这个documentation将
configMaps:
移动到根目录但是它破坏了普罗米修斯配置。
正如您在文件/terraform/kubernetes/files/prometheus_config_map.yaml
中看到的那样,scrape_interval
是15s
但是当我检查Prometheus UI配置时,所有的scrape_interval都是30s,因此,可以肯定的是部署的Prometheus的配置不是来自这个文件。因此,我没有办法更改scrape_interval之类的配置
我还在这个文档中注意到我在文件
/terraform/kubernetes/helm_values/prometheus.yaml
中缺少很多配置,但我不确定要添加什么。你能告诉我如何解决这个问题吗?提前谢谢你。
在 values.yaml 中,如果您检查该行:577
https://github.com/bitnami/charts/blob/master/bitnami/kube-prometheus/values.yaml
有一个选项可以将配置映射挂载到部署中。
应该安装到 Prometheus Pod 中的 ConfigMaps
configMaps:[]
您可以将配置映射设置为部署并更改间隔时间。
如果它没有使用配置映射值,它必须使用卷中的默认配置,或者直接您可以进入 POD 并检查一次以进行验证。
最后我用curl来做。脚本如下:
#get the image_artifacts and change to url format
Image_artifacts=$(printf ${Image#*/}|jq -sRr '@uri'|sed 's|%2F|%252F|g')
curl -u $Harbor_User:$Harbor_Passwd -H "Content-Type: application/json" -X GET "http://${Harbor_Address}/api/v2.0/projects/$Project/repositories/${Image_artifacts}/artifacts?page_size=100"|jq '.[]|select (.pull_time>"2023-02-06")'|jq '.tags[].name'