在编写元数据文件时,ThriftParquetWriter实际上会生成两个文件:_metadata和_common_metadata
这两个文件有什么区别?它们具有不同的文件大小,因此必须存在差异
谢谢
在查看https://github.com/apache/parquet-mr/blob/master/parquet-hadoop/src/main/java/org/apache/parquet/hadoop/ParquetFileWriter.java的源代码时,在我看来:
_common_metadata
包含该目录中镶木地板文件的合并模式
_metadata
将仅包含该目录中最近编写的镶木地板文件的模式