Cassandra-HDD与SSD的使用没有吞吐量差异

问题描述 投票:0回答:1

上下文我目前正在单节点群集上使用Apache Cassandra运行测试。我已使用nodetool状态确保集群已启动并正在运行,已经完成了许多这样的读和写建议,并且我确信我的集群已正确设置。我现在正在尝试通过将SSD挂载到Cassandra写入数据的目录上来提高吞吐量。

我的解决方案Cassandra数据的写入位置通常位于/ var / lib / cassandra / data中,但是我此后使用cassandra.yaml将我的数据切换到另一个位置,即我已安装SSD的位置。我已经通过watch du -h和其他方法检查了数据目录内容的大小,从而确保Cassandra正在写入该位置。我在其上安装了SSD的目录包括表数据,提交日志,提示,嵌套的数据目录和save_caches。

问题我一直在使用YCSB基准测试(请参见https://github.com/brianfrankcooper/YCSB)来测试Cassandra的平均吞吐量和ops / sec。我发现在Cassandra写入数据的位置安装HDD与SSD时,平均吞吐量没有差异。我分析了通过dstat -cd --disk-util --disk-tps进行的磁盘访问,发现HDD在多个实例中限制了CPU的使用,而SSD在某些情况下仅会飙升至80%左右。

问题如何通过HDD使用SSD来提高Cassandra的吞吐量?我认为这是安装我的SSD的正确位置,但是Cassandra是否没有利用其额外的处理能力?任何帮助将不胜感激!

cassandra hard-drive throughput ssd
1个回答
0
投票

SSD应该总是在延迟等方面胜过HDD。这只是物理定律。我认为您的测试根本无法在系统上提供足够的负载。另一个问题可能是,您仅将数据装载到SSD上,而不将装载日志装载到HDD上,因此应始终将它们放在单独的磁盘上,以避免与数据加载冲突。在SSD上,它们可以与数据放在同一磁盘上-请指向所有目录以查看SSD的区别。

© www.soinside.com 2019 - 2024. All rights reserved.