MarkLogic群集的体系结构

问题描述 投票:1回答:1

我当前的数据库大小约为1.7 TB

我正在重新设计MarkLogic集群。

我能够绘制此群集配置。

enter image description here

在图像中,灰色列为主要林,蓝色列为副本(*-R-*)。

注意:MODULES TO BATCH数据库中没有太多数据。

集群是否需要任何修改?或这很好吗?

marklogic
1个回答
0
投票

在您的体系结构中,两个以上的副本可能不会很有用。您有5台主机,因此您可能会丢失2台。一旦丢失第3台主机,您的群集将没有enough hosts for a quorum,并且将不可用。还需要注意的是,每个副本也会增加主机的负载和集群内协调流量。

您确实将内容林副本划分到了群集主机之间,这是推荐的方法。建议进行条带化以确保任何一台主机故障都不会使另一台主机过载,但是在这种情况下,来自一台主机的所有负载都将转移到另一台主机上。 5个主目录林分布在5个主机上,每个主机管理着20%的负载。如果任何一台主机发生故障,带有副本的主机上的负载将达到40%,而其余负载将保持在20%。可以通过增加每个主机上的主要林的数量来减轻这种影响。

例如,如果10个主要林分布在5台主机上,并且副本在这些主机之间进行条带化,则当一台主机发生故障时,两台主机将分别管理30%的负载,而其他两台主机则分别保持20%的负载。对于您而言,此设置的缺点是要拥有HA,每个主机将需要4个内容林(2个主目录和2个副本),而当前每个主机仅需要3个内容林(1个主目录和2个副本)。

此外,您的主要内容林中有1.7 Tb的内存,每个林中大约有348 GB。通过增加主要林的数量,查询响应时间也可以减少。如果有10个林,则每个主要林的最终存储量约为174 Gb。假设您have the cpu threads and memory available支持额外的森林,那么这可以缩短响应时间。

总而言之,将副本林的数量减少到不超过2个。测试主机在发生故障时是否可以支持加倍的工作负载;如果不能,则通过增加主要内容的数量来减轻风险森林。

© www.soinside.com 2019 - 2024. All rights reserved.