在我的工作场所,我们的每个 ES 索引都配置为恰好有 5 个分片,并且我们不使用 Rollover API 或 ILM。我们的大多数索引都非常小,但我们有一个大型索引,其中每个单独的分片都接近 250 GB。现在正在讨论摄取额外的数据,这将使该索引的大小大约增加一倍。
我正在尝试打破这一点,因为根据我对最佳实践的理解(例如Elastic Co.在这里描述的那些)分片理想情况下应该是<=50GB. My understanding of the risks involved with letting shards get too big:
这些准确吗?我还应该注意其他风险吗?我还有点担心,由于分片可能会出现大内存问题,整个集群可能会变得不稳定。这是一个有根据的担忧吗?
这就是大量碎片的一些不好的一面。在实践中,您可能会面临许多其他问题。所以你应该提前正确规划分片数量。