Impala外部表分区在删除HDFS中的数据并改变(如 ALTER TABLE table RECOVER PARTITIONS
)令人耳目一新(REFRESH table
)和元数据的无效化。
试图一个一个地删除分区是可行的,但有几十个分区需要删除,这将是相当繁琐的。
丢弃并重新创建表也是一种选择,但这样一来,所有的统计数据都会和表一起被丢弃。
在impala中是否有其他的选项来完成这个任务?
通过HIVE找到了一个变通的方法。
通过发出 MSCK REPAIR TABLE tablename SYNC PARTITIONS
然后在impala中刷新表,空的分区就会消失。