我已将应用程序打包为 docker 映像。将其上传到 ECR 并将该 docker 镜像拉入 AWS Sagemaker 实例。我可以通过 Sagemaker 内的终端手动执行此 docker 映像。
但我只想在最终用户从外部(互联网)通过 REST API 调用时触发此 docker 映像。我看到可以在 Sagemaker 中创建端点,但是在我读过的所有文档中,它期望创建和配置模型。例如:https://docs.aws.amazon.com/sagemaker/latest/dg/create-multi-model-endpoint.html。但在我的例子中,模型位于 docker 镜像本身内部,因此无需配置模型。
因此,当 REST API 调用时,如何在 AWS Sagemaker 中执行此 docker 镜像?
如果您已将模型烘焙到图像中,那就可以了。然后,您可以将模型数据 s3 位置留空。对于 SageMaker 端点,容器需要响应 /ping 和 /incalls。
请参阅 https://docs.aws.amazon.com/sagemaker/latest/dg/your-algorithms-inference-code.html