我知道clickhouse是一个面向列的数据库,可以服务于OLAP目的。然而,spark 和 clickhouse 似乎都支持分布式计算、列式存储(spark 中的 parquet 文件)、内存处理、基于 sql 和其他一些功能(索引、分区......)。有人可以解释一下,在大数据架构中,在哪些情况下我应该使用 Spark 而不是 Clickhouse,反之亦然?谢谢
选择 ClickHouse 还是 Apache Spark 取决于所需的结果。