hiveql 相关问题

Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。

我们可以检查Hive表的大小吗?如果是这样,如何?

我在Hive中有很多表,并且怀疑这些表的大小在群集上引起空间问题。有没有一种方法可以一次检查Hive表的大小?如果是这样,怎么办?我们可以使用...

回答 1 投票 0

如何通过order by子句对分区列执行差异?

请考虑如下表:col1 col2 col3 1000RR 100000 2000RR 400000 3000RR 300000 4000 YYY 200000 5000 YYY 400000 6000RR 400000 6000 ZZZ 500000输出...

回答 1 投票 1

将Apache Superset与Hive连接

我的Hadoop集群在AWS环境中运行,该环境已使用Hive映射了架构。而且我可以在Hive中看到完整的数据。现在,这是问题所在-我正在尝试将我的配置单元连接到...

回答 1 投票 1

如何将SQL查询转换为HiveSQL并获取最小日期?

如何将SQL查询转换为HiveSQL并获取最小日期而不是使用datepart,如下所示:%sql-清除表(如果已存在)DROP TABLE IF EXISTS栏; -创建临时表...

回答 2 投票 0

Apache Hive分区和存储分区结构

在Apache Hive中,在对巨大的数据集进行分区然后进行存储之后,目录结构如何显示?对于Ex-我有一个国家/地区的客户数据集,数据正在按...

回答 1 投票 3

蜂巢中的减速器选择

我有以下记录集要处理,例如1000、1001、1002到1999、2000、2001、2002到2999、3000、3001、3002到3999,并且我想以这种方式使用HIVE处理以下记录集。 。

回答 1 投票 1

在Hive中折叠行并保留非null值

我在Hive中有一个表,其中athr_name和post_date字段为90%空(在Hive中由'?'表示)。我想查询表和GROUP BY athr_name,post_date,page_nm和visit_date到...

回答 1 投票 0

蜂巢中的分组/窗口化

在下图中,第一个是有问题的表(提供的脚本),第二个是预期的输出。在C列中,我们有不同的项目,例如T1,T2,T3,这些记录将按组显示,T1 ...

回答 1 投票 0

Hive Bucketing:唯一列值的数量大于存储桶数的数量

[在配置单元中,说我有一个拥有1000条记录的表员工,并且我正在处理主题列。主题列的总不同值是20,但我的存储桶总数是6。...

回答 2 投票 0

请求中缺少年级的月份

我想在请求中列出两个日期之间的缺失日期,例如我的数据:TABLE ORDER YEAR_MONTH |金额202001 | 500 202001 | 600 201912 | 100 201910 | ...

回答 1 投票 0

如何通过在Hive中保留数据中的毫秒数将UTC转换为CST时间戳

我有一个配置单元表,其中带有时间戳记数据类型的数据为UTC格式。我在此表的顶部创建了一个视图,以将夏时制转换为UTC到CST。这种转换工作正常。 ...

回答 1 投票 1

请求中缺少添加日期

我想在请求中列出两个日期之间的缺失日期,例如我的数据:TABLE ORDER DATE_order |金额01/01/2020 | 500 01/01/2020 | 600 03/01/2020 | 100 ...

回答 1 投票 1

蜂房中排序依据与顺序的澄清

我正在阅读Hive手册下方,并被文档https://cwiki.apache.org/confluence/display/Hive/LanguageManual+SortBy上解释的细节所迷惑,首先它说Hive使用......]

回答 1 投票 1

Theta join in Hive

我在SAS中有theta联接,需要将其转换为Hive。 SAS:从左外部加入公司b的雇员中选择a.id,b.name(a.id = b.id和a.joindate> = b.joindate和a.releasedate&...

回答 1 投票 1

Spark SQL性能调整

[我在ETL开发团队中工作,在该团队中,我们使用Spark-SQL通过依次创建和处理几个中间临时视图并最终进行处理以最终转变为另一个临时视图的方式来进行数据转换...

回答 1 投票 1

如何在Hive表中将所有时间戳转换为EST

我有一个Hive表,其中包含一个时间戳字段,并且它可以具有任何时区..(UTC / PST / CST ....)我想将它们全部转换为一个时间戳,EST。它可以在Hive或Pyspark中完成。...

回答 1 投票 0

Hive订单号如何?

我注意到一个奇怪的Hive行为。似乎无法正确排序列。这就是我所做的:从t中选择TAUX_REMU_RESEAU,其中id ='000000010302'; //返回7423.00,从t中选择TAUX_REMU_RESEAU ...

回答 2 投票 1

从具有多个分区列的配置单元表中获取最新数据

我有一个配置单元表,具有以下结构ID字符串,值字符串,年int,月int,天int,小时int,分钟int该表每15分钟刷新一次,并按年/月/日/进行分区。 。

回答 1 投票 1

HIVE中的子查询

我在HIVE中有此嵌套子查询。当我执行1个子查询时,我的结果返回正常。但是,当我尝试添加第二个子查询时,出现以下错误。准备错误:org.apache.hive ....

回答 1 投票 0

如何在Hive中使用正则表达式提取第二个整数?

[数据:买2买5(商店)买2买10 [商店]我尝试了:regexp_extract(DATA,'。*?(\\ d +)。* $',2)所需结果:5 10

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.