设置端点时,我认为该过程涉及创建推理模型,在端点配置中指定该模型,然后使用该端点配置来建立端点。
那时,推理模型似乎有两个位置,而不是一个模型的两种表示;它们似乎独立存在:
这是我的问题:
谢谢
文档和研讨会似乎只是正确描述了 Python SDK 的用法,如果有人能为我解决这个问题,那将会非常有帮助
您对创建端点的过程是正确的,即模型 -> 端点配置 -> 端点。
模型注册表基本上只是一个包含模型版本的注册表。要从模型注册表部署任何这些版本,您仍然需要创建模型 -> 端点配置 -> 端点。
模型注册表目前仅在 Studio UI 上可用 不过,模型可在 AWS 控制台和 Studio UI 上使用。在新的 Studio UI 中,您可以转到模型 -> 可部署模型选项卡并查看所有模型。