hiveql 相关问题

Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。

在配置单元中更改列名称后,列的值变为NULL

在配置单元表上工作,我需要按以下方式更改列名,它按预期方式工作并更改列名,但是此列的下划线值变为NULL。 ALTER TABLE ...

回答 1 投票 0

Hive-根据hdfs中三个csv文件的特定数据创建hive表

我有三个.csv文件,每个文件位于不同的hdfs目录中。我现在想用这三个文件中的数据制作一个Hive内部表。我想要第一个文件中的四列,第二个文件中的三列...

回答 1 投票 0

仅属于给定的String列表或其元素组合的Hive过滤器值

我正在处理蜂巢表,我必须根据地理位置提取数据。我只需要过滤AMER区域的数据,我的意思是列contrycode仅包含一个或任何一个...

回答 3 投票 0

仅属于给定字符串列表的Hive过滤器值

我正在处理蜂巢表,我必须根据地理位置提取数据。我只需要过滤AMER区域的数据,我的意思是列contrycode仅包含一个或任何一个...

回答 1 投票 0

需要对一列进行groupby添加以获取Hive中另一列的计数

这里是示例数据:在上表中,我们可以看到a1,a2,a3和a4都具有src1。我只需要a3和a4作为结果,因为它们是仅嵌入了src1的仅有的行。 a1和a2 ...

回答 1 投票 0

使用Hive分隔符:

我想提取具有诸如W:X:Y:Z之类的值的列A。我有兴趣从列A中提取Z。我尝试了多个命令,例如SPLIT(Table.A,“ [:]” [3]),但出现错误。什么是...

回答 1 投票 1

Hive SQL逻辑-语句时的情况

我的查询:当上(a.camp_name)像“%Event%”和(上(a.camp_name)不像“%Event-WBR%”或上(a.camp_name)像“%Event-Webinar”时的情况%“),然后以“战术”结尾“场”,否则以“需求”结尾...

回答 1 投票 0

如果在Hive表/ DataFrame中找不到值,则获取下一个最大值

我有两个Hive表/ Spark数据框A和B A -------- + ---------- + ------ + product |日期| id | -------- + ---------- + ------ + A | 20200201 | X | -------- + ---------- + ------ + B | ...

回答 1 投票 0

Hive嵌套查询左联接

我是hive的新手,我想实现以下查询,请选择a.controlid,b.name作为广告系列,a.controlactivityid作为活动源,c.code作为codemyaprc,...

回答 1 投票 0

Hive表达式不在GROUP BY键'pat_dtl_start_dt'(状态= 42000,代码= 10025)

SQL代码:CREATE TABLE dev.new存储为orc tblproperties(“ orc.compress” =“ SNAPPY”)AS SELECT pat_dtl_start_dt,individual_id,bdy_lctn_cd,prcdr_cd,trtmnt_cd,SUM(allw_amt)来自dev.old GROUP BY ...

回答 1 投票 0

HIVE-将select语句的结果作为多个记录插入到hive表中,而不会覆盖现有内容

我从以下命令中得到一张表:CREATE TABLE treatment_costs AS SELECT * FROM(SELECT r。Patient_ID,r.transaction_date,r.paid_transaction_amount,o.dob,o.department_name,o.reason_of_visit ...

回答 1 投票 1

配置单元表采样和存储分区

我是Hive的新手,遇到了一些问题。我现在正在学习存储桶,我的任务是创建一个包含2个存储桶的Hive表,然后将至少5条记录放入该表中。好吧,那一部分...

回答 1 投票 0

Hive:将两个映射合并为一列

我有一个配置单元表作为创建表mySource(col_1 map ,col_2 map ),这里的记录看起来像col_1 col_2 {“ a”:1,“ ...

回答 1 投票 0

按日期Hive计算单个组每月的交易数量

我有一张客户交易表,客户购买的每件物品都存储为一行。因此,对于单个事务,表中可以有多行。我还有一个叫...

回答 1 投票 0

Hive联接查询优化

表A --------- col1,col2,Adate,qty表B ------- col2,cost,Bdate表的大小如下:A:100万B:700k考虑此查询:SELECT A.col1,A.col2,B.Bdate bdate,SUM(...

回答 2 投票 1

具有拼花地板数据格式重新排列列的蜂房表

我们使用的是配置单元1.1.0,要求重新排序具有100列的巨大表之一的列,以提高用户的可读性。但是,当我们对表中的列进行重新排序时,其失败并显示以下错误。 ...

回答 2 投票 1

如何使用sqoop将数据导出到具有自动增量ID的Microsoft Sql表?

我在Microsoft Sql上有一张表,其中字段ID设置为自动递增。我想将数据从hadoop导出到此sql表。我创建了一个hiveql表来镜像sql表,并尝试设置null ...

回答 1 投票 0

从HiveQL的url字段中解析和提取字段

我从表中获得此数据:id,uri,date_entered,p_id,ads_id 1,http://vegiefood.com/path1/p.php?keyword = veganway&country = france#Ref1,30 / JUN / 2016,PVEGIEFOOD ,GOOGLEADSENSE 2,http:// ...

回答 1 投票 0

如何从Hive映射中获取唯一键列表

我在Hive的一列中存储了一个映射,其中每行的键可以不同。如何从每个地图中获取仅键的列表?

回答 1 投票 0

使用Case Hive查询查找ID是否匹配并替换

我有一个名为“ Scan”客户交易的表,其中对每个不同的交易,一个personal_id都会出现一次,并且包含诸如scan_id之类的列。我还有另一个称为id的表,其中包含...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.