如何在同一个微服务中为多个ML / DL模型提供服务？ [关闭]

Question

背景

我们现在有一个在生产环境中运行的深度学习模型，该模型具有GPU和较高的CPU要求，不适用于特定类别。

因此，目前，我正在为特定类别开发新的ML模型。它实际上并不需要GPU，而且对于这种新型号，CPU较少也很有利。

当前基础结构

问题

Answer 1

听起来您正在做应做的事。由于这些型号的硬件要求截然不同，因此尝试通过相同的流程为其提供服务是没有意义的。您最好在这两种ML服务之前创建网关或路由服务，这两种服务负责根据输入选择要使用的模型。