impala 相关问题

Apache Impala是Apache Hadoop的开源原生分析数据库。 Impala由Cloudera,MapR,Oracle和亚马逊提供。

可以通过Impala在事务中应用许多DDL吗?

我正在使用Cloudera Impala 2.8.0-cdh 5.11.1,并想一次(一次)为事务中的多个表应用一些DDL(更改表集位置'...')。有什么办法可以做到吗?我有...

回答 1 投票 1

如何在Impala Hadoop中解压缩复杂的列?

我有一个表,该表具有a:Int b:array >我选择*时无法查看复杂列b。我应该使用什么查询通过连接解包?

回答 1 投票 0

[从Windows计算机使用python连接到impala。错误:“ TSocket”对象没有属性“ isOpen”

我想在Windows计算机上使用python 3.7.3(Anaconda,Jupyter Notebook)访问impala。我正在尝试执行以下代码:从impala.dbapi import connect import import traceback try:...

回答 1 投票 2

如何在Impala中使用大量数据解决空白岛问题

具有在Impala表中存在类型2维度,该表具有〜500M行,具有102列:(C1,C2,...,C8,... C100,Eff_DT,EXP_DT)仅需要选择具有不同组合的行的值...

回答 1 投票 0

基于可变日期范围(impala)的窗口上的总列值

给出如下表:client_id日期连接--------------------------------------- 121438297 2018-01-03 0 121438297 2018-01-08 1 121438297 2018-01-10 3 ...

回答 1 投票 0


通过数据阶段插入表KUDU

我正在写信以询问我的过程中的问题:我有一个Kudu表,当我尝试通过datastage(11.5或11.7)插入新行时,使用...时该行的大小大于500个字符。

回答 1 投票 1

OPLON LBL ADC:如何为虚拟域设置“粘性会话”?

我需要在多个端点之间平衡HTTP请求,并且我需要确保将来自同一用户(浏览器)的后续请求转发到相同的端点。我该如何实现...

回答 1 投票 0

在蜂巢和黑斑羚中使用不同的分隔符创建表

我需要您在Hive中的桌子的帮助。我的问题是我必须插入以下数据:HD_4K; Number_Channel; ID_Channels; Type; Name_Channel; 4K; 45; “ 1; 2; 3; 4; 5; 6”;系列;频道...

回答 1 投票 0

在Cloudera Impala(虚拟机)中创建数据库时出错

我已经下载并使用impala启动了cloudera虚拟机。在执行数据库创建语句时,出现了与目录和状态存储服务有关的错误。 ...

回答 1 投票 0

如何将聚合的数据“取消分组”到行?

我有一个具有类似架构的表:basket_id |产品|卷101 |苹果| 3102 |苹果| 2102 |橙色| 2我试图将表“取消分组”或“分解”到...

回答 2 投票 0

如何使元数据无效,刷新和在Impala中插入

[尝试通过Impala加载(通过插入)HDFS表时出现元数据错误。 INVALIDATE METADATA s.event_table;如果不存在则创建表t.target_table; INVALIDATE METADATA ...

回答 1 投票 0

Impala与Spark的即席查询性能

我仅对查询性能原因及其背后的体系结构差异感兴趣。我以前见过的所有答案都已过时或没有为我提供足够的WHY Impala上下文信息更好...

回答 1 投票 0

Impala-将整个表的NULL替换为零

您好,专家们-是否有必要将impala中整个表的null替换为零?到目前为止,我只发现合并或大小写-何时,这使我可以逐列更改..但是我有...

回答 1 投票 -1

在SQL查询中搜索'$'字符

如何在SQL查询中搜索“ $”特殊字符?我正在尝试使主机以$字符结尾。这是Apache Impala。我试过这个:从dclogwindows SELECT DISTINCT(host)主机喜欢'%...

回答 2 投票 0

hive / impala元数据刷新

当在蜂巢中更改分区位置时,REFRESH table命令是否刷新黑斑羚中的元数据?更改分区位置时,REFRESH table命令是否刷新黑斑羚中的元数据...

回答 1 投票 1

当月和上月值的总和

我有一个源表,其中包含每个月的员工帐户详细信息,日期是字符串类型(yyyyMMdd)。尝试查找每个帐户的当前月份值和上个月值的总和。来源...

回答 1 投票 3

选择Impala中的stack()UDTF

在Hive中,我可以像这样使用stack()UDTF采样数据:与学生一起使用(选择stack(5,1,'Vikrant',2,'Abhishek',3,'Ragesh',4,'Valeriy',5 ,'Swarna')as(id,name))从学生中选择*; ...

回答 1 投票 0

过去3个月内且最近30天内的审核脚本

我正在尝试运行一个查询,该查询使我能够查看在过去30天内交付中运行的脚本早于3个月的地方,因此我们知道需要对其进行更新。我已经能够...

回答 1 投票 0

如果2行的数据匹配2列,则不包括数据行

设置:数据存储在hadoop上,并在Impala中进行查询。我正在尝试创建一个查询,使我能够详细了解我们从客户那里看到的交货情况(它们的交货量是...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.