我有一个Solr云(版本7.4),有2个节点(每个节点有10Gb SSD硬盘和256Gb内存和50Gb堆)和10个集合。
一个集合有120亿个文档,其余的集合有10亿个文档。
我们并不确切知道有多少分片适用于我的用例。
如何确定适当数量的着色器以及每个集合适合多少个碎片?
它有配方吗?
碎片应位于不同的硬件上以获得最佳性能(这就是您进行分片的原因)。现在有2个节点,你几乎应该选择2个分片。但是对于您可能需要更多节点并添加更多分片后的性能。
自然性能不仅仅是分片/节点数量的一个因素,而且还是每个节点有多少内存(堆和堆外),CPU,读/写混合,网络速度,磁盘I / O速度等等。提及autoCommit / autoSoftCommit设置与索引大小和预期负载的比较。