使用Apache Drill从Azure Blob存储读取Parquet文件时出错

问题描述投票：2回答：1

我目前正在尝试使用Apache Drill从Azure Blob存储读取Parquet文件。我为azure-storage-8.6.3.jar和hadoop-azure-3.2.1.jar添加了.jar文件。

我能够读取存储在Blob存储中的JSON文件（请参阅下面的第一个屏幕截图），但是，当我尝试读取Parquet文件时，出现以下错误：

错误[HY000] [地图] [钻取]（1040）钻取未能执行查询：SELECT * FROM az.default。./CLTYP/CLTYP_2020_04_29_09_57.parquet LIMIT 100[30038]查询执行错误。细节：[系统错误：StorageException：在实体的当前状态下不允许执行请求的操作。请参考日志以获取更多信息。

然后我将Parquet文件下载到我的笔记本电脑上，能够毫无问题地浏览它（请参见下面的第二张屏幕截图。）>

我是Drill的新手，不确定如何进行操作？我不确定为什么Parquet无法读取JSON的原因？花了一些时间寻找我看到的特定错误，但没有任何运气。在这方面的任何帮助将不胜感激。

我正在运行：具有MapR Drill ODBC驱动程序版本的Windows 10上的Apache Drill 1.17.0：1.3.22.1055

Reading JSON file

Reading the Parquet file from disk

我目前正在尝试使用Apache Drill从Azure Blob存储读取Parquet文件。我为azure-storage-8.6.3.jar和hadoop-azure-3.2.1.jar添加了.jar文件。我能够读取JSON文件...

azure

azure-storage

azure-storage-blobs

apache-drill

1个回答

0
投票

您是否已解决此问题？请分享详细信息。

使用Apache Drill从Azure Blob存储读取Parquet文件时出错

问题描述 投票：2回答：1

1个回答

最新问题

问题描述投票：2回答：1