apache-drill 相关问题

Apache Drill是一种适用于大规模数据集的低延迟分布式查询引擎,包括结构化和半结构化/嵌套数据。它能够以JSON和Parquet等格式查询嵌套数据并执行动态模式发现。

Apache Drill > sqlline:如何运行包含变量的 sql 脚本

我是Apache Drill的新手,我需要通过sqlline运行SQL脚本。在大多数SQL客户端中,是允许在sqlline中使用一些变量的,所以请问可以吗...

回答 3 投票 0

嵌入式 Apache Drill 由于 VPN 无法连接

我尝试在嵌入模式(drill-embedded)下使用 Apache Drill,但是当它启动时显示错误: 错误:连接 Drill 失败:org.apache.drill.exec.pc.RpcException:CONNECTIO...

回答 2 投票 0

使用 Apache Drill+MongoDB 创建的数据集不包含值为 null 或空数组的列

我已通过 Apache Drill 将 Apache Superset 连接到 MongoDB。在 Apache Drill Web UI 中查询时,所有数据均正确显示。 我尝试在 MongoDB 中创建一个具有架构的数据集,但它创建...

回答 1 投票 0

Apache-Drill 中的 PostgreSQL 连接

我正在尝试使用以下配置让 Apache Drill 连接到 PostgreSQL 数据库 # 存储插件-override.conf “postgresql”:{ “类型”:“jdb...

回答 2 投票 0

将 Drill 版本升级到 > 1.14.0 时出现异常 NoClassDefFoundError JniBasedUnixGroupsMapping

对于安装在 Hadoop EMR 核心节点上的 Drill 集群,我们使用基于 PAM 的身份验证。这是下面的配置。 安全.用户.auth: { 启用:真, 包裹 +=...

回答 0 投票 0

如何使用 Drill 查询 parquet 中的 WKT 列?

我想在 Apache Drill 中查询的镶木地板文件中有地理空间数据的文本 WKT 列。我正在运行 Drill 版本 1.21.1。 镶木地板文件具有这种布局(来自镶木地板工具的输出): ....

回答 0 投票 0

如何使用 Spark/Python 将 API 数据添加到我的 MongoDB 中?

我正在使用此 API https://www.balldontlie.io/api/v1/players 开发一个项目,并一直在尝试将其添加到 MongoDB 中的数据库中。 有没有办法使用 Spark 将它添加到 MongoDB 中? 我...

回答 0 投票 0

分布式钻头无法启动。"Drillbit不允许在分布式模式下绑定回环地址。"

我有(3)个CentOS8 VirtualBox虚拟机,启用了网络,每个虚拟机都分配了16GB内存。每个都有etchosts配置为这样。127.0.0.1 localhost localhost.localdomain localhost4 localhost4... ...

回答 1 投票 0

无法在分布式模式下启动钻孔机。

我正在尝试设置 drillv1.18运行。面临以下错误。drill-override.conf指向运行在12181端口的zookeeper。在分布式模式下启动时,出现以下错误......

回答 1 投票 0

Apache Drill: 从Json数据中选择时创建表错误

下面的命令可以正常工作。SELECT TO_TIMESTAMP(`ts`,'yyyyMMddHHmmss') FROM dfs.tmp`maprmy.cluster.comhivecpf_sales.json 但是当我试图从select语句创建一个表时,它......

回答 2 投票 0

从JetBrains JDBC驱动程序执行Drill查询时出现引用错误。

我在JetBrans(Rider 2019.2)中有一个自定义的数据源驱动,它使用apache-drill-1.17.jar JDBC驱动(官方)。使用该驱动导致了这个错误。SELECT * FROM dfs.my_parquets. "Test"...。

回答 1 投票 1

使用Apache Drill从Azure Blob存储读取Parquet文件时出错

我目前正在尝试使用Apache Drill从Azure Blob存储读取Parquet文件。我为azure-storage-8.6.3.jar和hadoop-azure-3.2.1.jar添加了.jar文件。我能够读取JSON文件...

回答 1 投票 2

Apache Drill查询执行计划不使用MongoDB索引

查询计划显示的是对mongo集合中所有行进行的集合扫描。因此,我在where子句列上创建了一个索引,期望Drill选择基于...的索引...

回答 1 投票 0

Parquet文件中的空值最佳做法

如果我有一个可能包含null值的字符串列,我试图找出最佳实践。在SQL数据库中,null是一个合法的值,但是通过阅读我发现很多问题,并且...

回答 1 投票 0

如何从SAP HANA智能数据访问生成的Apache Drill中的查询中删除双引号?

我有一些配置单元表,我正在尝试使用智能数据访问虚拟表在HANA中进行访问。我正在使用MapR钻odbc驱动程序并相应地设置dsn。现在,我可以刷新我的远程设备了...

回答 1 投票 0

Drill ERROR:具有相同键的多个条目

从Postgresql RDBMS插件中选择会在WITH子句组合中导致此错误。使用src AS(从dfs.test中选择“ ArticleId”,“ Test”。“ SomeParquet”,在 )中选择“ ...

回答 1 投票 0

Amazon linux Ec2实例显示一些最近提取的文件的uid / groupid为'1000',但是我的etc / passwd文件中没有这样的uid / gid

TL-DR:在具有Amazon Linux AMI的AWS Linux EC2中,我看到用户/ groupid拥有的某些目录/文件为'1000'。但是我没有任何用户具有此userid / groupid。我检查了我的etc / ...

回答 1 投票 0

如何从apache演练的时间戳字段中提取日期部分?

我在钻取表中有一个时间戳字段(例如date_time),如何仅从同一字段中提取日期字段。在这里看到了很多日期运算功能,但没有一个起作用。这是示例...

回答 1 投票 0

Drill Web UI中的分布式模式下堆内存使用不可用

我在3个节点上安装了Drill(1.16版),并使用分布式模式。 Becuz当我实现查询(联接多个表)时,我想分配内存使用情况。但是,当我进入Drill Web UI时,只有...

回答 1 投票 0

从ZooKeeper中找不到活动的Drillbit端点

我目前正在与一个简单的项目一起使用Apache Drill查询来自Apache Kafka主题的消息。现在我在运行Apache Drill集群时遇到错误...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.