2000 亿行表的多重查询

问题描述投票：0回答：0

我有一个专用的 SQL 池，它有 2000 亿行表，具有散列分布且没有数据倾斜。有多个具有某些条件的 CTAS 被调用，它们使用这个 200M 行表作为基表。由于数据量大，执行这些 CTAS 的 SP 需要 5 到 10 个小时。有没有什么方法可以优化，比如为 CTAS 中使用的所有查询（有大约 10 个 CTAS）创建非聚集索引（表有 CCI）？

我想到了分区，但是没有有效的键列，因为这不是事实表。此外，该表已经分布在 15 个节点和 60 个分布中检查数据倾斜但没有数据倾斜

一个简单的选择查询大约需要 2 个小时才能完成。

非常感谢任何提高性能的想法/提示/建议。

谢谢。

sql

indexing

partitioning

azure-synapse-analytics

2000 亿行表的多重查询

问题描述 投票：0回答：0

最新问题

问题描述投票：0回答：0