我的表格有几个有序类别,并带有 pandas 标签。
我想知道哪些文件格式可用于从支持有序分类数据的 pandas 导出。
例如 STATA 表 (.DTA) 支持此数据类型。
我知道我可以存储整数并存储额外的参考表,但是将任何内容存储在一个文件中将使我的文件结构更加清晰和可靠。
我在此链接中找到了解决方案:
https://towardsdatascience.com/the-best-format-to-save-pandas-data-414dca023e0d
HDF5、Feather、Parquet 和 STATA 文件尤其适合 Feather。然而,Feather 适合项目内部使用。 Parquet 提供与 Feather 几乎相同的性能,并且还允许部分加载数据。