hiveql 相关问题

Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。

将日期分割为Hive或SQL Server中的多个日期范围

我想将以下日期转换为不同的日期范围,此处emp属于2019年5月25日至2099-02-14年之间的钦奈地区,但介于emp之间,emp在2020-02-15年至2020年之间由DEL工作-...

回答 2 投票 0

提高配置单元托管表中插入覆盖的性能

我是Hive的新手,我想知道表属性的列表,以提高hive托管表中插入覆盖的性能。有人可以帮忙吗?

回答 1 投票 1

Hive查询以使用正则表达式提取字符串的一部分

需要使用regexp_extract进行Hive查询以提取字段(字符串类型)的一部分。其中的值是用冒号分隔的字段字符串:ID(1001):10 | Value(1002):8 | Name(xyz):7需要提取值...

回答 1 投票 1

配置单元:如何消除重复的子字符串

配置单元表:创建表T(i int,s字符串);插入T值(1,“ a1&b2”),(1,“ b2&c3”),(2,“ c1&d2”),(2,“ c1”); s列包含用&...

回答 1 投票 1

如何在spark sql case / when语句中为多个列分配值

我的病情严重。我从案例陈述中得出2个字段。我可以编写2个case语句(完全相同的逻辑)以分别导出每个字段值。我可以知道吗...

回答 1 投票 0

如何将jsonarray从配置单元转换为多列

示例:在配置单元表中有一个json数组列(类型:字符串),例如:“ [{” filed“:” name“,” value“:” alice“},{” filed“:” age“, “ value”:“ 14”} ......]“”如何将其转换为:name age alice ...

回答 1 投票 0

为具有不同ID的记录插入行

我想为表格中存在的每个不同ID插入一行。为每个不同的ID添加这些行的最佳和有效方法是什么? ID名称计数----- ---...

回答 1 投票 0

我如何在Hive CLI中检查设置?

我想在hive命令中运行一个hive查询,我想使其更快,所以我运行了:hive:messages> set mapred.job.priority = VERY_HIGH; hive:messages> set hi = 1;但实际上我可以设置...

回答 1 投票 5

在日期/时间范围内的查询配置单元分区表

我的蜂巢表按年,月,日,小时进行分区现在我想从2014-05-27到2014-06-05提取数据?我知道一个选择是在纪元(或yyyy-mm-dd-hh)上创建分区,然后...

回答 3 投票 5

Hive Bucket的最大功能

我在HIVE中具有如下表结构-如果不存在则创建表cdp_compl_status(EmpNo INT,RoleCapability STRING,EmpPUCode STRING,SBUCode STRING,CertificationCode STRING,...

回答 1 投票 0

用于为一个ID为一个产品选择多个记录的SQL查询

我的表看起来像这样,我要实现的目的是为一个拥有最早日期产品| type_id |的产品的一个用户提取所有记录。用户|日期|希望以ROW_NUMBER作为...

回答 2 投票 0

如何在蜂巢或python中计算周数?该周应从星期六到星期五运行

我尝试了以下操作:选择weekofyear(current_timestamp)但这将计算从星期一到星期日的星期。我想要从星期六到星期五的一周,因为它应该填充一周...

回答 2 投票 1

如何在蜂巢或python中计算星期数。星期应从星期六到星期五开始

我尝试了以下操作:选择weekofyear(current_timestamp),但这将计算从星期一到星期日的星期。我希望从周六到周五的一周,因为它应该填充周数。 ...

回答 2 投票 1

在回溯期内存储最大交易量并保持第二高的交易量

我有以下查询(HiveQL),它从进行交易之日起计算客户的最大交易金额,并保留先前的先前最大交易金额...

回答 1 投票 0

如何在Hive中对整行进行md5?

[使用Hive,我希望对查询中的整个行进行哈希处理。我尝试了以下操作(不要介意$ {xxx},查询是从bash脚本构建的):从$ {DATABASE_NAME_SUFFIXE}中选择md5(*)。$ {...

回答 1 投票 0

HIVEX SQL中的REGEXP_SUBSTR等效项?

早上好。我正在Hive中寻找REGEXP_SUBSTR中的等效项,我在其他数据库(如Teradata)中使用了该等效项。我的具体情况是:我有一个包含字符串的字段。看起来像...

回答 1 投票 1

如何对特定的SQL列进行分组并检索那些列的计数最高的行?

我有以下数据:col_1 | col_2 | col_3 | col_4 ----------------------------- a1 b1 c1 d1 a1 b2 c1 d1 a1 b3 c1 d1 a1 b4 c1 d2 a1 ...

回答 2 投票 -1

配置单元:如何将yyyy-mm-ddThh:mm:SS:sssZZ转换为小时单位

我有以下时间戳记:2020-03-09T07:34:06:825Z 2020-03-09T07:54:12:220Z 2020-03-09T03:54:11:041Z 2020-03-09T09:22:10 :220Z 2020-03-09T11:13:36:217Z 2020-03-09T11:23:26:040Z 2020-03-09T11:43:...

回答 2 投票 2

如何将前两个配置单元表中的数据加载到下面的第三个配置表中?

下面是我面临的问题的简化版本,假设我在Hive中有一个员工和一个部门表。我的目标是将这两个表中的数据加载到下面的第三个表中。但是,...

回答 1 投票 0

Hive:在Hive sql中进行转置的方法

我正在尝试在Hive中转置以下结构的数据集:Id1 Id2事件1 1 7 2 2 3 2 2 7 3 3 8 8 3 3 1 2 3 1 2 7一些id组合具有...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.