我想知道关于 parquet 文件的扩展是否有共识。我见过一个较短的
.pqt
扩展名,它具有典型的 3 个字母(如 csv、tsv、txt 等),然后还有一个相当长(因此非常规(?))的 .parquet
扩展名,被广泛使用。
任何人都知道什么扩展名是“官方”的,如果使用
.pqt
(我个人喜欢)就可以了。
.parquet
是最常用的扩展。三字母文件扩展名是文件长度受到严格限制的时代的残余。如今,较长的名称很常见(例如database.sqlite)。
对!维基媒体基金会使用 .parquet 扩展文件的示例如下:https://huggingface.co/datasets/wikimedia/wikipedia/tree/main/20231101.es