雪花中的压缩分析

问题描述 投票:0回答:2

在redshift中,我们可以运行“分析压缩”。这为我们提供了有关每列发生的压缩百分比的信息。我们在雪花中有类似的命令吗?

compression snowflake-cloud-data-platform
2个回答
1
投票

Snowflake 的关键概念之一是自动存储处理:

数据库存储

当数据加载到 Snowflake 中时,Snowflake 会将该数据重新组织为其内部优化的压缩柱状格式。 Snowflake 将此优化的数据存储在云存储中。

Snowflake 管理数据存储方式的各个方面 - 组织、文件大小、结构、压缩、元数据、统计数据以及数据存储的其他方面均由 Snowflake 处理。 Snowflake存储的数据对象不能被客户直接看到或访问;它们只能通过使用 Snowflake 运行的 SQL 查询操作来访问。

微分区的好处

Snowflake 对表数据进行分区的方法的优点包括:

  • 顾名思义,微分区尺寸很小(压缩前为 50 到 500 MB),这可以实现极其高效的 DML 和细粒度修剪,以实现更快的查询。

...

  • 列也在微分区内单独压缩。 Snowflake 自动为每个微分区中的列确定最有效的压缩算法。

如果“分析压缩”的目标是找到潜在的磁盘减少收益,则该过程已经完成。


0
投票

根据所选的架构和索引,Snowflake 可以实现不同的压缩性能。有更多与压缩相关的指标来优化它会很有用,因为我发现存储并不便宜。

© www.soinside.com 2019 - 2024. All rights reserved.