2000 亿行表的多重查询

问题描述 投票:0回答:0

我有一个专用的 SQL 池,它有 2000 亿行表,具有散列分布且没有数据倾斜。 有多个具有某些条件的 CTAS 被调用,它们使用这个 200M 行表作为基表。 由于数据量大,执行这些 CTAS 的 SP 需要 5 到 10 个小时。 有没有什么方法可以优化,比如为 CTAS 中使用的所有查询(有大约 10 个 CTAS)创建非聚集索引(表有 CCI)?

我想到了分区,但是没有有效的键列,因为这不是事实表。 此外,该表已经分布在 15 个节点和 60 个分布中 检查数据倾斜但没有数据倾斜

一个简单的选择查询大约需要 2 个小时才能完成。

非常感谢任何提高性能的想法/提示/建议。

谢谢。

sql indexing partitioning azure-synapse-analytics
© www.soinside.com 2019 - 2024. All rights reserved.