hiveql 相关问题

Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。

已解决的HiveQL-分组计数

我是这里的新手,在HiveQL中仍然面临很多问题,需要与大家咨询。我有一个名为“投票表”的表,我想对A,B,C,D表示赞成(对不起,我无法...

回答 1 投票 2

如何将共享ID的多行合并为一个单行(HQL)?

在较长的JSON解码结束时,我得到了以下Hive表:+ ---- + -------- + --------- + -------- + | ID | field1 | field2 | field3 | + ---- + -------- + --------- + -------- + | 1 | T | NULL | NULL | | ...

回答 1 投票 1

HiveQL-分组计数

我是这里的新手,在HiveQL中仍然面临很多问题,需要与大家咨询。我有一个名为“投票表”的表,我想对A,B,C,D表示赞成(对不起,我无法...

回答 1 投票 2

编写SQL&Hive查询以打印每个国家第二高薪的年份?

编写SQL和HIVE查询以打印每个国家第二高薪的年份?。请提供以下国家/地区的薪水查询:印度,年薪,印度,1000、2017,日本,2000、2017 ...

回答 2 投票 0

立即创建新列并在SELECT中使用它

如何动态定义新列并在同一SELECT语句中使用它?选择“ a” AS colA,colA +“ b” AS colB我更喜欢不使用子查询。

回答 1 投票 0

替代带有NOT IN子句的Hive查询

我有以下一组配置单元表:创建表image_additions(customer_id STRING,image_key STRING,image_size STRING);创建表image_removals(customer_id STRING,...

回答 1 投票 1

Hive数据类型问题

我们从源头获得3列,colA为3位数字,colB为5位数字,而ColC为5位数字。我们需要基于以上3列创建13位唯一ID,使用的查询-选择colA * 1000000000000 + ...

回答 1 投票 0

配置单元:查询以获取每个日期每个单词的最大计数

以下是我拥有的数据:日期|字| count 01/01/2020 #abc 1 01/01/2020 #xyz 2 02/05/2020 #ghi 2 02/05/2020 #def 1 ...

回答 1 投票 0

Hive按组计算中位数和平均值

[我有一个按州和县计数的数据集,我想按州和县计算中位数和平均值,例如:具有:ID州县计数1 MD aa 2 2 ...

回答 1 投票 0

配置单元:使用regexp作为单独的列拆分字符串

我在文本列中有一个字符串。我想将字符串中的主题标签值提取到新表中,以便为每个主题标签找到不同的计数。示例字符串-> NeverTrump是...

回答 2 投票 2

如何以编程方式在Hive中查找外部表的所有文件位置?

我在Hive中有一些外部表,想编写一个脚本来调整其中的数据。由于Hive是读取文件的真实来源,因此我想获取...

回答 2 投票 0

Hive:添加一列,该列的值重复特定行中的特定columnn吗?

我在Hive中有一个表,看起来像这样的产品。 '根产品|产品展示日期A A 2012 A B 2013 A C 2013 D ...

回答 1 投票 0

带有SERDEPROPERTIES抛出错误的配置单元创建表

我的Hive创建表查询的下面部分失败:ROW FORMAT DELIMITED NULL DEFINED AS''WITH SERDEPROPERTIES(...

回答 1 投票 0

用于生成基于新列的匹配字段值的SQL逻辑

输入:CUST TAX_TYPE a TIN a TIN a SSN b TIN b TIN b TIN c SSN c SSN c null输出:CUST TAX_TYPE VALID a TIN ...

回答 2 投票 0

HIVE-SQL_SERVER:HadoopExecutionException:此行中的列不足

我有一个具有以下结构和数据的配置单元表:表结构:如果不存在,则创建外部表db_crprcdtl.shcar_dtls ID字符串,CSK字符串,BRND字符串,MKTCP字符串,...

回答 1 投票 1

跨多个分区的Hive表重复数据删除

我正在尝试复制一个表,该表可能在各个分区中都有重复项。例如id device_id os country unix_time app_id dt 2 2 3a UK 7 5 2019 -...

回答 1 投票 1

如何从订单表中找到有关后续客户ID的两个订单之间的日期范围?

例如,假设我们有一个customer_id = 1,他在2年内下了3个订单,并且他的1st Order_date ='2015年1月1日'2nd Order_date ='2015年6月5日'3rd Order_date ='2016年2月2日'。这有...

回答 1 投票 0

如何在Hive中将int数组的元素连接为字符串

我正在尝试将int数组的元素连接到蜂巢中的一个字符串。函数concat_ws仅适用于字符串数组,因此我尝试使用cast(my_int_array作为字符串),但是它不起作用。任何...

回答 2 投票 1

如何通过关键字的出现和最长时间选择记录

我正在尝试选择包含某些关键术语的记录组,并在每个包含最大时间的组中提取行。 df1:id1 id2名称时间1 ...

回答 1 投票 0

HIve:从ORC转换为TEXT时数据格式更改

我有一个具有以下架构的配置单元表:CREATE EXTERNAL TABLE db_test.user_arry(cstid string,prdctsslctd array ,indvprc array ,dscntamt array ]

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.