复制因子

问题描述 投票:1回答:3

我是Hadoop的新手,我想了解我们如何确定任何给定集群可以拥有的最高复制因子。我知道默认设置是3个副本,但是如果我有一个具有5个节点的集群,那么在这种情况下我可以使用的最高复制因子是什么。我们必须遵循一个公式来确定复制因子吗?

谢谢

hadoop replication
3个回答
1
投票

您可以使用的最高复制因子是群集中节点数量的函数(如@Tarik所说,您的群集中的节点不能有更多副本),您的预期用量(您计划存储多少数据)和您的群集的存储容量。

其他SO question对容量和存储使用进行了一些计算。


0
投票

显然,您不能拥有比节点更多的副本,因为在同一节点上存储两个副本是没用的。在我看来,这是上限。


0
投票

在Hadoop环境中,3台从属计算机的默认复制因子为3或更多。这是一个简单的公式,即'N'复制因子='N'从节点。这里有关于复制http://commandstech.com/replication-factor-in-hadoop/的更多信息

© www.soinside.com 2019 - 2024. All rights reserved.