端点部署状态失败,同时通过 AKSCompute/AMLCompute(两者)部署模型

问题描述 投票:0回答:0

在这里,当我使用 AKSCompute 运行部署代码时,出现错误

Tips: 你可以尝试get_logs(): https://aka.ms/debugimage#dockerlog 或本地部署: https://aka.ms/debugimage#debug-locally 如果部署时间超过10,可以调试分钟。 跑步 2023-04-20 11:42:01+05:30 创建容器注册表(如果不存在)。 2023-04-20 11:42:01+05:30 注册环境。 2023-04-20 11:42:02+05:30 使用现有图像。 2023-04-20 11:42:03+05:30 在 AKS 中创建资源。 2023-04-20 11:42:04+05:30 提交部署到计算。 2023-04-20 11:42:04+05:30 检查部署 aiops-model-service-error 的状态。 失败的 输出超出大小限制。在文本编辑器中打开完整的输出数据 服务部署轮询达到不成功的终端状态,当前服务状态:失败 操作 ID:f65019a8-3178-48e7-b28b-1c65d28f13de 可以使用“.get_logs()”找到更多信息 错误: { “代码”:“KubernetesDeploymentFailed”, “状态码”:400, "message": "Kubernetes 部署失败", “细节”: [ { “代码”:“CrashLoopBackOff”, "message": "你的容器应用程序崩溃了,因为它没有 AzureML 服务堆栈。 确保你的 pip 依赖项中有 'azureml-defaults>=1.0.45' 包,它包含 AzureML 服务堆栈的要求。” }, { “代码”:“部署失败”, "message": "您的容器端点不可用。请按照以下步骤进行调试:

inference_config = InferenceConfig(source_directory = './service_files',
                                   entry_script="scoring_script.py",
                                   environment=myenv)

deploy_config = AksWebservice.deploy_configuration(cpu_cores = 0.1,
                                                   memory_gb = 0.5)

model = ws.models['model_from_run_local_5']

service = Model.deploy(workspace=ws,
                       name = 'aiops-model-service-error',
                       models = [model],
                       inference_config = inference_config,
                       deployment_config = deploy_config,
                       deployment_target = production_cluster)

service.wait_for_deployment(show_output = True)

这是我使用的代码和环境environment。我什至尝试使用 AMLCompute,但我遇到了同样的错误。

azure azure-aks azure-machine-learning-service azure-deployment azureml-python-sdk
© www.soinside.com 2019 - 2024. All rights reserved.