apache-drill 相关问题

Apache Drill是一种适用于大规模数据集的低延迟分布式查询引擎,包括结构化和半结构化/嵌套数据。它能够以JSON和Parquet等格式查询嵌套数据并执行动态模式发现。

从ZooKeeper中找不到活动的Drillbit端点

我目前正在与一个简单的项目一起使用Apache Drill查询来自Apache Kafka主题的消息。现在我在运行Apache Drill集群时遇到错误...

回答 1 投票 0

Windows 10上的Apache Drill 1.17.0-无法运行钻取(嵌入式模式)

详细信息:Apache Drill 1.17.0 Windows 10 64位Java JDK1.8.0_241全新安装。无法使Apache Drill成功加载。命令行:c:\ Users \ floodb \ Software \ Drill \ apache-drill-1 ....

回答 1 投票 0

如何在Apache Drill中为Mongo Storage插件实现内部联接的优化(下推?)>

我想扩展Apache Drill Mongo存储插件以压低INNER JOIN。因此,我想将INNER JOIN重写为mongo聚合管道。我们需要如何开始...

回答 1 投票 14

Apace Drill读取gz和快速的性能

我正在使用Apache Drill 1.8。为了测试海豚,我用.csv制作了两个实木复合地板文件。 CSV大约为4GB,使用gz编解码器为120MB的拼花地板,以及带有快速编解码器的大约250GB的拼花地板。如...

回答 1 投票 1

Apache Drill占用大量堆空间

我在具有3个节点ZK仲裁的3个节点上以分布式模式运行Apache Drill版本1.15,以查询一个150MB的小型csv文件。但是,Drill继续使用4GB-6GB的堆内存。为了测试,我有...

回答 1 投票 0

列名未在Apache Drill中的JDBC扫描中传递给PostgreSQL

[尝试为PostgreSQL运行SQL查询时,不是将表中的列名引用为它将*向下推送到数据库。从中选择m.id,cnt_c_no(从...中选择m_id ...

回答 1 投票 1

如何在Apache演练中进行不区分大小写的比较

我试图连接来自不同数据源(RDBMS和json)的两个表,但是,查询成功,但是一个表(json数据源)中的数据为大写,而另一个表(RDBMS ... ...)中的数据

回答 1 投票 1

Apache演练无法正确解析Windows EOL的CSV文件?

好吧,让我们为某人节省8个小时的无知调试。 TL; DR:Apache演练无法正确解析Windows计算机上生成的CSV文件。这是因为默认情况下,他们的EOL设置为\ r \ n,与...

回答 1 投票 0

如何在apache钻取查询where子句中使用算术运算符?

我正在尝试使用Apache Drill查询镶木地板文件。我想对值进行排序并获得FloatCol1的最大值。因此,以下查询有效。从dfs.tmp.`tmp.parquet`中选择*,顺序为...

回答 1 投票 0

找不到Windows类上的Apache钻GUI SQuirrel

我正在尝试在Windows 10上使用Apache钻取GUI,我已经按照其链接https://drill.apache.org/docs/using-jdbc-with-squirrel-on-windows/上的所有说明进行操作,并添加了驱动程序显示...

回答 1 投票 0

如何使用presto查询hdfs文件>>

我正在尝试像Apache Drill一样使用Presto查询hdfs文件。我已经搜索了,但是由于缺少Presto资源而发现了任何东西。我可以使用配置单元连接器查询hdfs数据,这没有问题。但是我...

回答 1 投票 0

如何在钻取查询中用JSON文本取消CSV列的引用

我的CSV文本文件具有类型的列数据。它是带有引号转义的JSON。 {\“ code \”:\“ SOURCE \”,\“ display \”:\“ NPPES \”}]}}我无法使用点...

回答 1 投票 0

集成Apache Superset和Apache Drill

我通过Drill文档中的链接安装了Apache Drill。 Apache Drill工作正常。我还安装了Apache Superset并使其使用docker运行。 Superset也可以正常工作。但是我的...

回答 1 投票 0

如何将查询导出到文件

我需要将查询导出到文件。我正在尝试(从dfs.ff.filea.json中选择A.分隔字段...

回答 3 投票 0

如何将Apache Drill选项配置为环境变量?

我想通过启动钻头在系统级别将drill.exec.hashjoin.fallback.enabled设置为true。我可以在会话期间设置它,例如alter session setdrill.exec.hashjoin.fallback.enabled = TRUE ;, ...

回答 1 投票 3

Apache Drill的JPAM配置

我正在尝试基于JPAM 1.1配置PLAIN身份验证,并且由于在x次检查我的语法和设置后无法正常工作而感到疯狂。当我开始使用cluster-id和zk -...

回答 1 投票 0

一旦查询完成,如何在apache演练上释放堆内存?

问题很简单,每次我查询钻探时,堆内存都会不断累积。我的堆内存为7 GB,但没有刷新。每隔15分钟,我必须杀死钻子,然后...

回答 1 投票 0

使用DefaultAWSCredentialsProviderChain将Apache Drill连接到Amazon S3

我正在尝试将apache演练连接到我的aws s3,而不在配置中指定我的访问密钥和秘密密钥,因此我添加了“ fs.s3a.aws.credentials.provider”:“ com.amazonaws.auth ... 。

回答 1 投票 0

钻无法读取大多数列在木地板火花产生

我在数据节点只(每32GB存储3个节点)的顶部上分布模式运行钻1.15。我试图读取HDFS中的星火作业生成拼花文件。生成的文件正在读取...

回答 1 投票 0

阿帕奇钻日志正则表达式插件

我试图使用Apache钻与日志文件正则表达式,我没有得到配置。我试图与网页https://drill.apache.org/docs/logfile-plugin/的相同的例子,但我得到一个错误,当我尝试...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.