计算集群不能根据需要动态分配内存吗?
这并不是一个“分配”内存的问题,而是了解工作负载的形状以将其最佳(或至少没有问题)地放置在集群中的问题。关键是可以将作业放置在具有足够内存来处理任务的节点上。这可以避免作业占用的内存多于节点上的可用内存时可能出现的问题。 如果调度程序只是让尽可能多的作业运行,而不考虑作业需要多少内存以及节点上有多少可用内存,则可能会耗尽节点上的可用内存,从而导致严重的性能问题(分页)、挂起,或 OOM 错误。