Apache Drill是一种适用于大规模数据集的低延迟分布式查询引擎,包括结构化和半结构化/嵌套数据。它能够以JSON和Parquet等格式查询嵌套数据并执行动态模式发现。
我目前正在与一个简单的项目一起使用Apache Drill查询来自Apache Kafka主题的消息。现在我在运行Apache Drill集群时遇到错误...
Windows 10上的Apache Drill 1.17.0-无法运行钻取(嵌入式模式)
详细信息:Apache Drill 1.17.0 Windows 10 64位Java JDK1.8.0_241全新安装。无法使Apache Drill成功加载。命令行:c:\ Users \ floodb \ Software \ Drill \ apache-drill-1 ....
如何在Apache Drill中为Mongo Storage插件实现内部联接的优化(下推?)>
我想扩展Apache Drill Mongo存储插件以压低INNER JOIN。因此,我想将INNER JOIN重写为mongo聚合管道。我们需要如何开始...
我正在使用Apache Drill 1.8。为了测试海豚,我用.csv制作了两个实木复合地板文件。 CSV大约为4GB,使用gz编解码器为120MB的拼花地板,以及带有快速编解码器的大约250GB的拼花地板。如...
我在具有3个节点ZK仲裁的3个节点上以分布式模式运行Apache Drill版本1.15,以查询一个150MB的小型csv文件。但是,Drill继续使用4GB-6GB的堆内存。为了测试,我有...
列名未在Apache Drill中的JDBC扫描中传递给PostgreSQL
[尝试为PostgreSQL运行SQL查询时,不是将表中的列名引用为它将*向下推送到数据库。从中选择m.id,cnt_c_no(从...中选择m_id ...
我试图连接来自不同数据源(RDBMS和json)的两个表,但是,查询成功,但是一个表(json数据源)中的数据为大写,而另一个表(RDBMS ... ...)中的数据
Apache演练无法正确解析Windows EOL的CSV文件?
好吧,让我们为某人节省8个小时的无知调试。 TL; DR:Apache演练无法正确解析Windows计算机上生成的CSV文件。这是因为默认情况下,他们的EOL设置为\ r \ n,与...
我正在尝试使用Apache Drill查询镶木地板文件。我想对值进行排序并获得FloatCol1的最大值。因此,以下查询有效。从dfs.tmp.`tmp.parquet`中选择*,顺序为...
找不到Windows类上的Apache钻GUI SQuirrel
我正在尝试在Windows 10上使用Apache钻取GUI,我已经按照其链接https://drill.apache.org/docs/using-jdbc-with-squirrel-on-windows/上的所有说明进行操作,并添加了驱动程序显示...
我正在尝试像Apache Drill一样使用Presto查询hdfs文件。我已经搜索了,但是由于缺少Presto资源而发现了任何东西。我可以使用配置单元连接器查询hdfs数据,这没有问题。但是我...
我的CSV文本文件具有类型的列数据。它是带有引号转义的JSON。 {\“ code \”:\“ SOURCE \”,\“ display \”:\“ NPPES \”}]}}我无法使用点...
集成Apache Superset和Apache Drill
我通过Drill文档中的链接安装了Apache Drill。 Apache Drill工作正常。我还安装了Apache Superset并使其使用docker运行。 Superset也可以正常工作。但是我的...
我想通过启动钻头在系统级别将drill.exec.hashjoin.fallback.enabled设置为true。我可以在会话期间设置它,例如alter session setdrill.exec.hashjoin.fallback.enabled = TRUE ;, ...
我正在尝试基于JPAM 1.1配置PLAIN身份验证,并且由于在x次检查我的语法和设置后无法正常工作而感到疯狂。当我开始使用cluster-id和zk -...
问题很简单,每次我查询钻探时,堆内存都会不断累积。我的堆内存为7 GB,但没有刷新。每隔15分钟,我必须杀死钻子,然后...
使用DefaultAWSCredentialsProviderChain将Apache Drill连接到Amazon S3
我正在尝试将apache演练连接到我的aws s3,而不在配置中指定我的访问密钥和秘密密钥,因此我添加了“ fs.s3a.aws.credentials.provider”:“ com.amazonaws.auth ... 。
我在数据节点只(每32GB存储3个节点)的顶部上分布模式运行钻1.15。我试图读取HDFS中的星火作业生成拼花文件。生成的文件正在读取...
我试图使用Apache钻与日志文件正则表达式,我没有得到配置。我试图与网页https://drill.apache.org/docs/logfile-plugin/的相同的例子,但我得到一个错误,当我尝试...