我无法将 EKS 节点加入 EKS 集群 (Terraform)

问题描述 投票:0回答:2

我正在使用 terraform v0.14.2 ,并且我正在尝试创建 EKS 集群,但在节点加入集群时遇到问题。状态一直停留在“Creating”直到出现错误:

我要部署的代码是:

错误:等待 EKS 节点组 (EKS_SmartSteps:EKS_SmartSteps-worker-node-uk) 创建时出错:NodeCreationFailure:实例未能加入 kubernetes 集群。资源 ID:[i-00c4bac08b3c42225]

resource "aws_eks_node_group" "managed_workers" {
  for_each        = local.ob

  cluster_name    = aws_eks_cluster.cluster.name
  node_group_name = "${var.cluster_name}-worker-node-${each.value}"
  node_role_arn   = aws_iam_role.managed_workers.arn
  subnet_ids      = aws_subnet.private.*.id
  scaling_config {
    desired_size = 1
    max_size     = 1
    min_size     = 1
  }
  launch_template {
    id      = aws_launch_template.worker-node[each.value].id
    version = aws_launch_template.worker-node[each.value].latest_version
  }

  depends_on = [
    kubernetes_config_map.aws_auth_configmap,
    aws_iam_role_policy_attachment.eks-AmazonEKSWorkerNodePolicy,
    aws_iam_role_policy_attachment.eks-AmazonEKS_CNI_Policy,
    aws_iam_role_policy_attachment.eks-AmazonEC2ContainerRegistryReadOnly,
  ]
  lifecycle {
    create_before_destroy = true
    ignore_changes = [scaling_config[0].desired_size, scaling_config[0].min_size]
  }
}

resource "aws_launch_template" "worker-node" {
  for_each               = local.ob

  image_id               = data.aws_ssm_parameter.cluster.value
  name                   = "${var.cluster_name}-worker-node-${each.value}"
  instance_type          = "t3.medium"

  block_device_mappings {
    device_name = "/dev/xvda"

    ebs {
      volume_size = 20
      volume_type = "gp2"
    }
  }
  tag_specifications {
    resource_type = "instance"
    tags = {
      "Instance Name" = "${var.cluster_name}-node-${each.value}"
       Name = "${var.cluster_name}-node-${each.value}"
    }
  }
}

事实上,我在 EC2 实例和 EKS 中看到连接到 EKS 集群的节点,但出现以下状态错误:

“实例加入 kubernetes 集群失败”

我无法检查错误在哪里,因为错误消息没有显示更多信息..

有什么想法吗?

谢谢

amazon-web-services kubernetes terraform amazon-eks
2个回答
2
投票

为了其他人可以遵循,您需要包含一个用户数据脚本来让节点加入集群。比如:

用户数据.tpl

MIME-Version: 1.0
Content-Type: multipart/mixed; boundary="==MYBOUNDARY=="

--==MYBOUNDARY==
Content-Type: text/x-shellscript; charset="us-ascii"

#!/bin/bash
set -ex
/etc/eks/bootstrap.sh ${CLUSTER_NAME} --b64-cluster-ca ${B64_CLUSTER_CA} --apiserver-endpoint ${API_SERVER_URL}

--==MYBOUNDARY==--\

像这样渲染它的地方

locals {
  user_data_values = {
    CLUSTER_NAME = var.cluster_name
    B64_CLUSTER_CA = var.cluster_certificate_authority
    API_SERVER_URL = var.cluster_endpoint
  }
}

resource "aws_launch_template" "cluster" {
  image_id  = "ami-XXX" # Make sure the AMI is an EKS worker
  user_data = base64encode(templatefile("userdata.tpl", local.user_data_values))
...
}

除此之外,确保节点组是工作线程安全组的一部分并且具有所需的 IAM 角色,这样就可以了。


0
投票

我也遇到同样的问题,请问这个问题解决了吗?我尝试了给出的解决方案,但它不起作用。我正在尝试使用 terraform 从头开始创建 eks 集群。我不确定我做错了什么。欢迎任何建议。

© www.soinside.com 2019 - 2024. All rights reserved.