我是容器和Kubernetes的新手。我正在Azure中进行大部分测试。
我创建了一个容器,并根据负载水平缩放容器。托管在我构建的容器中的终结点必须处理突发请求。我希望容器大部分时间都处于空闲状态,但是在我的测试中,它有时不得不扩展到多个实例以处理突发请求。
为了降低运行该服务的成本,我想知道是否有可能将容器的实例数缩减为0,同时保持在即将到来的请求时“唤醒”容器的能力。在?我该如何实现?
有许多与此功能有关的建议,但没有被合并到kubernetes中。
空闲/不空闲建议:
这是一个棘手的问题,因为服务启动时,传入的请求将需要排队。
如果您对实现此功能感兴趣,则似乎已经为您完成了一些工作,但是它不一定是您的用例的端到端解决方案:https://github.com/openshift/service-idler
这里是另一个解决类似功能的项目:https://github.com/deislabs/osiris