在redshift中,我们可以运行“分析压缩”。这为我们提供了有关每列发生的压缩百分比的信息。我们在雪花中有类似的命令吗?
Snowflake 的关键概念之一是自动存储处理:
当数据加载到 Snowflake 中时,Snowflake 会将该数据重新组织为其内部优化的压缩柱状格式。 Snowflake 将此优化的数据存储在云存储中。
Snowflake 管理数据存储方式的各个方面 - 组织、文件大小、结构、压缩、元数据、统计数据以及数据存储的其他方面均由 Snowflake 处理。 Snowflake存储的数据对象不能被客户直接看到或访问;它们只能通过使用 Snowflake 运行的 SQL 查询操作来访问。
Snowflake 对表数据进行分区的方法的优点包括:
- 顾名思义,微分区尺寸很小(压缩前为 50 到 500 MB),这可以实现极其高效的 DML 和细粒度修剪,以实现更快的查询。
...
- 列也在微分区内单独压缩。 Snowflake 自动为每个微分区中的列确定最有效的压缩算法。
如果“分析压缩”的目标是找到潜在的磁盘减少收益,则该过程已经完成。
根据所选的架构和索引,Snowflake 可以实现不同的压缩性能。有更多与压缩相关的指标来优化它会很有用,因为我发现存储并不便宜。