impala 相关问题

Apache Impala是Apache Hadoop的开源原生分析数据库。 Impala由Cloudera,MapR,Oracle和亚马逊提供。

计算统计 IMPALA 结果导致 DiskErrorException

我正在尝试通过 IMPALA (在 ClouderaDataPlatform 上)在我的一个表上执行计算统计信息 (COMPUTE STATS db.table;),但仅对于该表,我遇到以下错误:

回答 1 投票 0

Impala 日期格式

我有一个 impala 表,其中 report_date 列值以 yyyyMMdd 和 yyyy-MM-dd 字符串格式存储,例如 20210923 2021-09-23 我想将它们转换为日期格式 我尝试了以下两个命令...

回答 1 投票 0

为什么GROUP_CONCAT在Impala中不按指定列排序?

我正在尝试在 Impala 中使用 GROUP_CONCAT 函数,并且我想按其中一列对结果进行排序。这是我到目前为止所拥有的: SELECT 列 1、列 2、GROUP_CONCAT(列 3 ORDER BY 列...

回答 1 投票 0

group_concat() Impala 中 order by 的替代方案

我需要在group_concat()中对文本数据进行排序。问题是每次返回不同的序列。 我尝试在子查询中排序,然后使用 group_concat(),但它仍然返回...

回答 1 投票 0

如何增加 SQL 实验室和可视化的超集行限制和超时缓存

我有一个包含 10 亿行的数据集。数据存储在 Hive 中。另外,我将 Impala 作为 Hive 和 Superset 之间的一层。在 Superset 中运行的查询具有最大行限制。 100.000。我不...

回答 6 投票 0

SQLAlchemy 通过 cloudera ODBC DSN 访问 Impala 数据库时出现问题

我正在尝试通过 SQLAlchemy 访问 Impala DB - 我已经配置了一个 DSN,允许我在直接使用 pyodbc 时连接到数据库。 但是,当使用 SQLAlchemy 时,我收到错误: 当使用...

回答 2 投票 0

使用sql将字符串转为时间戳

有一列名称为request_time,其数据类型为字符串。数据类似于 01-03-2024 16:58:44。我想将其转换为配置单元中的时间戳。我已经尝试过一些事情,例如: 选择

回答 1 投票 0

需要从两个不同的表中删除匹配的数据

提前感谢您的帮助。 我必须表“ABC”,它是集中表,第二个是“XYZ”,它是由脚本生成的 GAP 表。现在我必须起来...

回答 1 投票 0

如何在 Impala 中读取 csv,其中字段包含在由分隔符组成的双引号内

如果我尝试通过 cab 文件创建 impala 外部表,该文件是管道分隔的,并且有几列包含在 "" 双引号中也包含分隔符 |管子,那怎么能...

回答 3 投票 0

如何访问 Impala 解析器

Impala 是否重用 hive SQL 解析器? 我正在尝试编写自定义 Java 代码来检查应用程序中查询的正确性。我正在寻找一个可以使用 sql 查询并让我知道的 api...

回答 2 投票 0

impala 将列转置为行

如何在impala中将列数据转置为行数据 我尝试了一些在黑斑羚中不起作用但在蜂巢中工作的解决方案。 表名:测试 数据: 日期名称 工作完成 2017-03-25 x_user ...

回答 1 投票 0

如何查找 Parquet 文件生成时使用的 COMPRESSION_CODEC?

通常在 Impala 中,我们在将数据插入底层文件为 Parquet 格式的表之前使用 COMPRESSION_CODEC。 用于设置 COMPRESSION_CODEC 的命令: 设置压缩_c...

回答 3 投票 0

如何在Python和Pandas(Data Frame)中将条件SQL查询的数据插入到Hbase?

假设我在 table_name_a 中有一些示例数据,如下所示: 代码 val_a val_b 备注 日期 ------------------------------------------ 1 00001 500 0.1 111 20191108 2

回答 1 投票 0

Datagrip |尝试连接到 impala 时 GSSAPI 启动失败

我尝试使用 jdbc 连接到 Impala,但收到以下错误: 无法连接到服务器:GSS 启动失败。 我之前确实运行过Kinit。 我正在运行 datagrip 2023.1.1,它...

回答 1 投票 0

我尝试使用 Sum() over(partition by ) 来查找两组数字之间的差异,但我得到了意想不到的结果

我正在使用 sql 和 tableau 创建燃尽图。我编写了一个 SQL 查询来为我完成大部分计算。我有一个看起来像这样的表结构 ld.cal_dt ld.camp_name ld.ld_cnt ...

回答 1 投票 0

Impala JDBC 错误:用户“”没有权限在表上执行“SELECT”

最近我为Hive启用了Sentry策略文件。因此,当我尝试使用 Impala-JDBC4(版本 2.5.16)在 Impala 中执行查询时,出现以下错误: 错误消息:AuthorizationException:用户''做...

回答 1 投票 0

获取当天的 UTC 日期和时间,并将其差异添加到 UTC 时间戳

我有一个这样的查询: 选择 * 来自我的事实 JOIN time_table 时间 ON ( time.time_5_min_utc = fact.event_5_min_utc ) WHERE fact.event_utc >= ${fromTimestamp} 和事实.event_utc < ${

回答 1 投票 0

在Hive查询(HQL)中创建两个日期之间的日期,稍后需要进一步转换

来源 所需输出 我想要的输出是 D 列和 C 列。 公式列可帮助您了解我如何进行计算。 我首先尝试根据最小日期和最大日期来分解日期。什...

回答 1 投票 0

CTE 的替代方案可提高查询性能

我正在 Impala SQL 中创建一个查询,该查询需要在聚合数据之前对数据执行操作。这是我的查询: 将 concatenated_addresses 作为 ( 选择站点名称,concat(parent_address_l...

回答 1 投票 0

如何解决HIVE中的时间戳代码错误

这里需要帮助。 我在 Impala 中运行下面的代码没有问题,但是当我在 Hive 中运行相同的代码时,它会出现错误消息。 任何人都可以帮助修改代码,以便我能够在 HIVE 中运行。 比...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.