使用Apache Drill从Azure Blob存储读取Parquet文件时出错

问题描述 投票:2回答:1

我目前正在尝试使用Apache Drill从Azure Blob存储读取Parquet文件。我为azure-storage-8.6.3.jar和hadoop-azure-3.2.1.jar添加了.jar文件。

我能够读取存储在Blob存储中的JSON文件(请参阅下面的第一个屏幕截图),但是,当我尝试读取Parquet文件时,出现以下错误:

错误[HY000] [地图] [钻取](1040)钻取未能执行查询:SELECT * FROM az.default./CLTYP/CLTYP_2020_04_29_09_57.parquet LIMIT 100[30038]查询执行错误。细节:[系统错误:StorageException:在实体的当前状态下不允许执行请求的操作。请参考日志以获取更多信息。

然后我将Parquet文件下载到我的笔记本电脑上,能够毫无问题地浏览它(请参见下面的第二张屏幕截图。)>

我是Drill的新手,不确定如何进行操作?我不确定为什么Parquet无法读取JSON的原因?花了一些时间寻找我看到的特定错误,但没有任何运气。在这方面的任何帮助将不胜感激。

我正在运行:具有MapR Drill ODBC驱动程序版本的Windows 10上的Apache Drill 1.17.0:1.3.22.1055

Reading JSON file

Reading the Parquet file from disk

我目前正在尝试使用Apache Drill从Azure Blob存储读取Parquet文件。我为azure-storage-8.6.3.jar和hadoop-azure-3.2.1.jar添加了.jar文件。我能够读取JSON文件...

azure azure-storage azure-storage-blobs apache-drill
1个回答
0
投票

您是否已解决此问题?请分享详细信息。

© www.soinside.com 2019 - 2024. All rights reserved.