我使用烧瓶和gunicorn在生产规模的机器学习模型上进行部署,但使用带有4名工人的gunicorn的记忆非常庞大(几乎是4x)没有枪支。 gunicorn可以使用更少的内存吗?
将您的工作人员调整为(2 * CPU)+1。这是使用工作线程和线程时建议的最大并发请求数。