提高配置单元托管表中插入覆盖的性能

问题描述 投票:1回答:1

我是Hive的新手,我想知道表属性的列表,以提高hive托管表中插入覆盖的性能。有人可以帮忙吗?

performance hive insert hiveql overwrite
1个回答
0
投票

一些建议:

  1. 关闭统计信息自动收集:

    set hive.stats.autogather=false;

  2. 如果可能,请提前删除分区文件夹或表文件夹,或使用PURGE选项:https://stackoverflow.com/a/39623927/2700344

  3. 如果您使用的是S3并且表是ORC,请禁用块填充:

    ALTER TABLE your_table SET TBLPROPERTIES ("orc.block.padding"="false", "orc.block.padding.tolerance"="1.0");

  4. 优化查询。

© www.soinside.com 2019 - 2024. All rights reserved.