hiveql 相关问题

Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。

DATE

我有两个表。我对表2中的每一个日期和类别对,我想计算从那天开始计算的该类别过去一周和两周的记录数。 表1

回答 1 投票 0

SQL到HiveQL的转换

我有这样一个SQL查询,我想把它转换为可以在HiveQL上运行的查询。SELECT p.id FROM page p, comments c, users u, WHERE c.commentid= p.id AND u.id = p.creatorid AND u.upvotes ....

回答 1 投票 0

sb2 11 sb2

我有以下Hive表CustID item_val 10 sb1

回答 1 投票 0

Spark + 写入Hive表+变通措施

我正试图了解我在工作区经常听到的一种方法的优缺点。Spark在将数据写入Hive表(InsertInto)时,会出现以下写到......

回答 1 投票 0

Hive - 从三个外部表创建一个内部表。

我在HIVE中有三个外部表:表1:CREATE EXTERNAL TABLE IF NOT EXISTS table_1( unique_key_column_1 VARCHAR, column_needed_1 DATE, column_needed_2 TIMESTAMP, column_needed_3 INT, ...。

回答 1 投票 0

HIVE SubQuery表达式指的是Parent和SubQuery表达式。

所以我有这个HIVE查询。SELECT p.id FROM posts p JOIN comments c ON c.postid = p.id JOIN users u ON u.id = p.owneruserid JOIN badges b ON b.userid = u.id CROSS JOIN postlinks l WHERE l......。

回答 1 投票 0

根据出生年月日计算年龄

我使用HiveQL,我需要使用出生日期列来计算年龄,但问题是GetDate不工作,而Current_Date()却可以。我正在尝试的例子是Ex: datediff(yy,...)

回答 1 投票 0

在Hive中创建表失败

我试图使用公共角色创建表,而且我已经在目标数据库上给用户分配了所有权限,但创建表脚本仍然失败--错误。错误:编译语句时出错。错误:编译语句时出错:...

回答 1 投票 0

Spark Hive:临时表在会话中消失

我在Hive中使用hive.executeUpdate("CREATE TEMPORARY TABLE AS SELECT ...")从Spark创建了几个临时表。我用hive.showTables().show()检查所有表,在会话间......。

回答 1 投票 0

案例语句处理逻辑与预期不同

我试图根据ID的数量来分配一个状态,使用一个指标。这是我写的查询(它的工作原理): select x.yyyy_mm_dd, x.prov_id, x.app, x.metric, x.is_100, ....

回答 1 投票 0

将Hive表数据导出到.csv中。

这个问题可能以前有人问过,我对HADOOP和HIVE语言比较陌生。所以我想导出内容,作为测试,看看我做的事情是否正确。代码如下。...

回答 1 投票 0

使用映射表在多列上进行连接

我有点需要帮助的这一个。我有客户表和映射表。我需要连接的表。场景是这样的。表1(customer): uid job level status 1 64 68 75 2 ...

回答 1 投票 0


Hive Sql查询从Json数组中获取Json对象。

我在 "content "列里有一个json,格式如下。{ "identifier": [ { "type": { "type": { "coding": [ { "coding": { "code": "MRN", }...

回答 1 投票 1

Hive ALTER命令删除数值超过24个月的分区。

我有一个hive表(consumer_data),表中的分区列'val_dt'是一个字符串列,其值的日期格式为'yyyy-MM'。我在表中有多个分区,从'2015-01'到'...'。

回答 1 投票 0

在hive中从横向视图转换为案例陈述。

我需要把下面的代码在案例语句:select count (*) from db.tab1 lateral view explode(secondary.tertiary) exp as lv where id IN ('6','1') and array_contains (lv.ci, "1"); 我已经试过: ....

回答 1 投票 0

蜂巢中的减速器数量和计数(不同)。

有人告诉我,count(distinct )可能会导致数据偏斜,因为只用了一个reducer。我使用一个有50亿数据的表做了一个测试,有两个查询,查询A:select count(distinct columnA)......。

回答 1 投票 0

UserName

我有一个名为 "Login "的Hive表。它包含以下列:- 用户ID

回答 3 投票 -4

秘密ZULU时间改为PST

我试图将yulu格式的start_time隐藏到pst中。开始时间样本: 2020-02-04T04:36:42:211Z from_unixtime(unix_timestamp(sub string(start_time,1,17),'yyy-MM-ddThh:mm:ss.SSSZ),'yyy-...'。

回答 1 投票 0

使用窗口Hive或spark scala进行数据排列。

我要整理数据。Ip: 需要用蜂巢或数据框架输出。ID P ID

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.