apache Spark 和 clickhouse 之间的主要区别是什么？又该如何选择呢？

问题描述投票：0回答：1

我知道clickhouse是一个面向列的数据库，可以服务于OLAP目的。然而，spark 和 clickhouse 似乎都支持分布式计算、列式存储（spark 中的 parquet 文件）、内存处理、基于 sql 和其他一些功能（索引、分区......）。有人可以解释一下，在大数据架构中，在哪些情况下我应该使用 Spark 而不是 Clickhouse，反之亦然？谢谢

apache-spark compare clickhouse

1个回答

0
投票

选择 ClickHouse 还是 Apache Spark 取决于所需的结果。

数据类型和数量：ClickHouse针对结构化数据分析进行了优化，而Spark则处理各种数据类型和处理需求。例如，如果您需要处理半结构化或非结构化数据，那么 Spark 是首选。但是，如果处理 CSV 或其他结构化数据类型，ClickHouse 更合适。
实时处理：ClickHouse 的速度非常快，但 Spark 在实时性能方面超越了它。如果您的任务涉及流式处理或类似任务等实时操作，那么 Spark 是更合适的选择。

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.