估计卡桑德拉的空间需求

问题描述 投票:0回答:1

估计Cassandra中所需空间的最佳/可靠方法是什么。我的集群由Cassandra 3.11.2上的2个节点(RHEL 6.5)组成。我想估计数据库中每个表中每一行的平均大小,以便我可以进行相应的计划。我知道一些方法,例如nodetool status命令,数据目录中使用的du -sh命令,nodetool cfstats等。但是,每个方法都给出不同的值,因此我不确定在计算中应使用哪个方法。

[此外,我还发现,除了实际数据之外,Cassandra还将各种元数据存储在特定于系统的各种表中,例如size_estimates,sstable_activity等。此元数据还会随着数据的增长而增加吗?这种元数据所占空间与数据库中实际数据所占空间的比率是多少?另外,我还应该记住YAML(如果有)中的哪些特定配置,这可能会影响数据的大小。

之前有人问过类似的question,但我对答案不满意。

cassandra cassandra-3.0
1个回答
0
投票

如果您期望每天有20 GB的数据,这是计算。

1天= 20 GB,1个月= 600 GB,1年= 7.2 TB,因此您一年的原始数据大小为7.2 TB,复制因子为3,那么一年的数据约为21.6 TB。

如果要进行大小分层压缩,请考虑压缩,并且用例会很繁琐。您将需要原始数据空间的两倍。

因此您将需要大约43 TB到45 TB的磁盘空间。

© www.soinside.com 2019 - 2024. All rights reserved.