我知道hdfs快照可以跟踪目录中添加或删除的文件。当我有连续附加文件(PARQUET)时的行为如何?
当您创建目录/文件的快照时,它们会添加到子目录/.snapshot中,因此无论文件格式是什么,它们都按日期升序排序!没有最大数量的快照。
hdfs snapshot保存从目录中添加或删除的文件的跟踪
如果我错了,请纠正我,但快照会记录每一个更改(甚至在文件中),而不仅仅是记录目录中添加和删除的文件。
我希望这能帮助你理解他们的行为!
HDFS snapshots documentation