AWS ECS使用相同的任务定义和映像重新启动服务,无需停机

问题描述 投票:8回答:7

我正在尝试重新启动AWS服务(基本上停止并启动服务中的所有任务),而不对任务定义进行任何更改。

原因是因为图像的每个构建都附有latest标记。

我已经尝试停止所有任务并让服务重新创建它们但这意味着当服务在我的实例中重新启动时会出现一些temporarily unavailable错误(2)。

处理这个问题的最佳方法是什么?说,一个蓝绿色的部署策略,以便没有停机时间?

这就是我目前所拥有的。它的缺点是,我的应用程序会在删除它们后重建服务的任务时停机几秒钟。

configure_aws_cli(){
    aws --version
    aws configure set default.region us-east-1
    aws configure set default.output json
}

start_tasks() {
    start_task=$(aws ecs start-task --cluster $CLUSTER --task-definition $DEFINITION --container-instances $EC2_INSTANCE --group $SERVICE_GROUP --started-by $SERVICE_ID)
    echo "$start_task"
}

stop_running_tasks() {
    tasks=$(aws ecs list-tasks --cluster $CLUSTER --service $SERVICE | $JQ ".taskArns | . []");
    tasks=( $tasks )
    for task in "${tasks[@]}"
    do
        [[ ! -z "$task" ]] && stop_task=$(aws ecs stop-task --cluster $CLUSTER --task "$task")
    done
}

push_ecr_image(){
    echo "Push built image to ECR"
    eval $(aws ecr get-login --region us-east-1)
    docker push $AWS_ACCOUNT_ID.dkr.ecr.us-east-1.amazonaws.com/repository:$TAG
}

configure_aws_cli
push_ecr_image
stop_running_tasks
start_tasks
amazon-web-services deployment amazon-ecs
7个回答
7
投票

使用update-service--force-new-deployment标志:

aws ecs update-service --force-new-deployment --service my-service

6
投票

等一下。如果我理解你使用正确,这在官方docs中解决:

如果更新的Docker镜像使用与服务的现有任务定义中相同的标记(例如,my_image:latest),则无需创建任务定义的新修订。您可以使用以下步骤更新服务,保留服务的当前设置,然后选择强制新部署....

为避免停机,您应该操作2个参数:最小健康百分比和最大百分比:

例如,如果您的服务具有所需数量的四个任务且最大百分比值为200%,则调度程序可以在停止四个较旧任务之前启动四个新任务(前提是执行此操作所需的群集资源可用)。最大百分比的默认值为200%。

这基本上意味着,无论您的任务定义是否发生变化以及程度如何变化,新旧变量之间都可能存在“重叠”,这是实现弹性和可靠性的方法。

更新:亚马逊只有用于ECS的introduced外部部署控制器(EC2和Fargate)。它包括一个名为TaskSet的新级别的抽象。我自己还没有尝试过,但是对服务和任务管理(两种API都支持)的细粒度控制可以解决类似这一问题。


3
投票

将新映像推送到Docker存储库后,可以使用create a new revision of your task definition(它可以与现有任务定义相同)和update your service来使用新的任务定义修订版。这将触发服务部署,您的服务将从存储库中提取新映像。

这样您的任务定义保持不变(尽管需要将服务更新为新的任务定义修订版以触发图像拉动),并且仍然使用图像的“最新”标记,但您可以利用ECS服务部署功能,以避免停机。


0
投票

事实上,即使任务定义本身没有任何变化,我每次都必须创建我的任务定义的新版本是不对的。

这里有一堆粗略的bash实现,这意味着AWS应该让ECS服务调度程序监听映像中的更改/更新,尤其是对于自动构建过程。

我的crude解决方案有两个相同的任务定义,并在每个构建之间切换它们。这样我就没有多余的修改。

这是执行该操作的特定脚本片段。

update_service() {
    echo "change task definition and update service"
    taskDefinition=$(aws ecs describe-services --cluster $CLUSTER --services $SERVICE | $JQ ".services | . [].taskDefinition")
    if [ "$taskDefinition" = "$TASK_DEF_1" ]; then
        newDefinition="$TASK_DEF_2"
    else
        newDefinition="$TASK_DEF_1"
    fi
    rollUpdate=$(aws ecs update-service --cluster $CLUSTER --service $SERVICE --task-definition $newDefinition)
}

0
投票

快速而肮脏的方式:

  • 登录到运行任务的EC2实例
  • docker container list找到你的容器
  • 使用docker restart [container]

0
投票

你有没有解决这个问题?也许这对你有用。

随着新版本图像被推送到带有版本标签的ECR,即v1.05latest标签,我的任务定义中的image定位器需要明确更新,以使此版本标签后缀为:v1.05

使用:latest,这张新图像在aws ecs update-service --force-new-deployment --service my-service之后没有被新容器拉动。

我正在做标记和推送:

docker tag ${imageId} ${ecrRepoUri}:v1.05
docker tag ${imageId} ${ecrRepoUri}:latest
docker push ${ecrRepoUri}

...这是推送多个标签的正确方法:

docker tag ${imageId} ${ecrRepoUri}
docker push ${ecrRepoUri}:v1.05
docker push ${ecrRepoUri}:latest

这在the official docs中没有一个恰当的例子简要提到过。


-1
投票

工作伟大的https://github.com/fdfk/ecsServiceRestart

python ecsServiceRestart.py restart --services =“app app2”--cluster = test

© www.soinside.com 2019 - 2024. All rights reserved.