我有一个专用的 SQL 池,它有 2000 亿行表,具有散列分布且没有数据倾斜。 有多个具有某些条件的 CTAS 被调用,它们使用这个 200M 行表作为基表。 由于数据量大,执行这些 CTAS 的 SP 需要 5 到 10 个小时。 有没有什么方法可以优化,比如为 CTAS 中使用的所有查询(有大约 10 个 CTAS)创建非聚集索引(表有 CCI)?
我想到了分区,但是没有有效的键列,因为这不是事实表。 此外,该表已经分布在 15 个节点和 60 个分布中 检查数据倾斜但没有数据倾斜
一个简单的选择查询大约需要 2 个小时才能完成。
非常感谢任何提高性能的想法/提示/建议。
谢谢。