hiveql 相关问题

Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。

SQL - 如何转置或转动来自不同表的列

表1:Primary_Key |城市|邮编1 | A | A 2 | C | D注意:City或Zip下的屏蔽值可以相同,在本例中,“A”将显示在City和Zip中。 ...

回答 2 投票 1

用另一栏“扩展”HIVE查询:性能和最佳实践

我有一个HIVE查询,使用GROUP BY计算一些值。 SELECT COUNT(DISTINCT user_id),date,operating_system,action FROM user_actions GROUP BY date,operation_system,action; ...

回答 1 投票 0

哪一个在Hive中更快? “在”或“或”?

“in”示例:select * from t where('a','b','c')“或”示例:select * from t where something ='a'或something ='b'或something =' c'这些之间是否存在效率差异......

回答 1 投票 0

用于合并数组的Hive Aggregate函数

我需要在HiveSQL中的GROUP BY中合并数组。表模式是这样的:key int,value ARRAY 现在这里是我想运行的SQL:SELECT key,array_merge(value)...

回答 1 投票 1

Hive - hive子查询的问题

我的问题陈述就像“查找每个州人口最多的前2区”数据就像输入我的预期输出是输出我尝试了很多查询和子查询但是......

回答 1 投票 1

SQL最早的记录

假设我有一个20列的表格订单。我只对前4列感兴趣:id,department_id,region_id,datetime其中id是客户ID,datetime是客户的时间......

回答 3 投票 2

Hive-On-Spark - 在execution.engine更改为Spark [duplicate]之后运行查询时出错

我最初写了一些Hive查询在Tez上运行。随着查询越来越复杂,数据越来越多,它们正在逐渐取消。正因为如此,我现在正试图对......进行点火。

回答 1 投票 0

Hive Map-Join配置之谜

有人能清楚地解释一下hive.auto.convert.join和hive.auto.convert.join.noconditionaltask配置参数之间的区别是什么?这些相应的尺寸......

回答 1 投票 0

在Hive中选择方括号和引号之间的值

我已经使用以下代码来连接结果SELECT COLLECT_LIST(col_name)AS my_col FROM my_table这有点实现了我想要的结果,输出如下:[“car”,“motorcycle”,“bus”] [...

回答 2 投票 1

如何将json字符串数据类型列转换为hive中的映射数据类型列?

我需要从所有行获取所有唯一键值。每行都有不同的键和值请找到上面的列图像。例如:一行看起来像{“START_TIME”:1549002807568,“......

回答 1 投票 1

在Hive JOIN中遇到左右别名;没有任何不平等条款

我正在使用以下查询:选择S.MDSE_ITEM_I,S.CO_LOC_I,MAX(S.SLS_D)为MAX_SLS_D,MIN(S.SLS_D)为MIN_SLS_D,sum(S.SLS_UNIT_Q)为SLS_UNIT_Q,MIN(PRSMN_VAL_STRT_D)为......

回答 3 投票 8

根据最大列值创建新列

我有一个查询,看起来像这个选择max(mytime),类型,我的表中的id,其中id = 1 group by id,type这给我的结果类似于时间类型id 2018-01-01 ...

回答 2 投票 0

新列根据另一列的最大值重复值

我有一张'mytable'表,其结果类似于以下当前时间种类的情人节2018-01-01 03:15:00金22 2018-01-01 04:15:00银......

回答 1 投票 1

hbase到hive集成失败

我在“hbase”表“hbase_sample”中有行,列族h1,其中有两个值id和name。我想在带有id和name列的hive中创建外部表,我不想写行或键字段。 ...

回答 1 投票 -1

String vs Varchar Hive查询性能

我有这个表有5个记录,大约25列,其中大多数是字符串类型。当我进行查询时,它持续大约47秒来获取结果。我为每个String列提供了2 GB的空间(...

回答 1 投票 1

处理参数传递给AWS数据管道中的SQL活动

我正在使用AWS数据管道。在这个上下文中,我将几个参数从管道定义传递到sql文件,如下所示:s3://reporting/preprocess.sql,-d,RUN_DATE=# {@ ...

回答 1 投票 1

GROUP BY中的MAX()用法与非数字列

我有一个类似于以下UserId |的表ActionType -------------------- 1 |创建2 |阅读1 |编辑2 |创建3 |阅读我想找到“最高”的动作......

回答 2 投票 0

在hive中运行HQL时抛出的异常

我想运行一个select语句并将结果放入表中,我确定它不是语法错误。 HQL:INSERT覆盖表datalake_rci.MID_DealerVehicleOutputValue --...

回答 2 投票 1

如何使用配置单元将列值分隔到不同的列

输入:名称年份1. a 2008 4 2. a 2009 3 3. a 2008 4 4. b 2009 8 5. b 2008 5蜂巢输出:名称2008 2009 1. a 8 3 2. b 5 8

回答 2 投票 1

Hive从具有不同模式的select语句插入到表中

对于Hive中的两个表:表A的模式:表名称的年龄模式表名:名称#表A中的“名称”类型和B都是字符串我想从表B中选择所有行然后追加它们。 。

回答 1 投票 3

© www.soinside.com 2019 - 2024. All rights reserved.