真空不删除旧的实木复合地板文件

问题描述 投票:0回答:1

我们有Azure数据湖以三角洲湖格式将数据存储在拼花文件中。在每次合并新数据的运行之后,我们将保留0小时的真空称为删除旧文件并运行optimize命令。

但是由于某些原因,旧文件不会被删除。但是在databricks笔记本中没有错误。它说2删除的文件,但我仍然看到它们。我缺少明显的东西吗?谢谢!

sqlContext.sql(f"VACUUM  '{adls_location}' RETAIN 0 HOURS")
time.sleep(60)
sqlContext.sql(f"VACUUM  '{adls_location}' RETAIN 0 HOURS")
time.sleep(60)
sqlContext.sql(f"OPTIMIZE '{adls_location}'")
apache-spark databricks azure-data-lake azure-databricks
1个回答
0
投票

您不能直接在云存储上使用VACUUM。要进行真空存储,必须将其安装到DBFS并在已安装的目录上运行VACUUM。

参考: Azure Databricks - Vacuum

© www.soinside.com 2019 - 2024. All rights reserved.