用于查看/编辑 Apache Parquet 的 GUI 工具

问题描述 投票:0回答:8

我有一些 Apache Parquet 文件。我知道我可以在 shell 中执行

parquet file.parquet
并在终端中查看它。但我想要一些 GUI 工具来以更用户友好的格式查看 Parquet 文件。有这样的程序吗?

apache hadoop parquet
8个回答
18
投票

Tad实用程序,它是跨平台的。允许您打开 Parquet 文件并旋转它们并导出为 CSV。使用 DuckDB 作为后端。更多信息请参见DuckDB页面

这里: https://github.com/antonycourtney/tad


15
投票

适用于 Windows、Linux、MAC 的 GUI 选项

您现在可以使用 DBeaver

  • 查看镶木地板数据
  • 查看元数据和统计数据
  • 对一个或多个文件运行 sql 查询。 (支持全局表达式)
  • 生成新的镶木地板文件。

DBeaver 利用 DuckDB 驱动程序对 parquet 文件执行操作。 DuckDB 还支持投影和谓词下推等功能。

只需使用 Dbeaver 创建 DuckDB 的内存实例,然后运行本文档中提到的查询。现在支持 Parquet 和 CSV

这里有一个 Youtube 视频解释了同样的内容 - https://youtu.be/j9_YmAKSHoA


8
投票

看看这个实用程序。适用于所有 Windows 版本:https://github.com/mukunku/ParquetViewer


4
投票

实际上我找到了一些Windows 10特定的解决方案。不过,我正在开发 Linux Mint 18,所以我想要一些 Linux(或者理想情况下跨平台)GUI 工具。还有其他 GUI 工具吗?

https://www.channels.elastacloud.com/channels/parquet-net/how-about-viewing-parquet-files


4
投票

有一个 GUI 工具可以查看 Parquet 以及其他二进制格式数据,如 ORCAVRO。它是纯 Java 应用程序,因此可以在 Linux、Mac 和 Windows 上运行。详情请查看大数据文件查看器

支持数组、映射、结构体等复杂数据类型。并且可以将读取的文件保存为CSV格式。


2
投票

有完全离线工作的 WebAssembly 查看器:https://aloneguid.github.io/parquet-online/


1
投票

JetBrains(IntelliJ、PyCharm 等)有一个用于此目的的插件,如果您有专业版本:https://plugins.jetbrains.com/plugin/12494-big-data-tools


0
投票

有选项卡实验室Parquet Viewer。它允许您查看和过滤 Parquet 文件。您还可以制作图表使用sql查询镶木地板

Tab Lab Parquet Viewer gif

© www.soinside.com 2019 - 2024. All rights reserved.