Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。
在配置单元表上工作,我需要按以下方式更改列名,它按预期方式工作并更改列名,但是此列的下划线值变为NULL。 ALTER TABLE ...
Hive-根据hdfs中三个csv文件的特定数据创建hive表
我有三个.csv文件,每个文件位于不同的hdfs目录中。我现在想用这三个文件中的数据制作一个Hive内部表。我想要第一个文件中的四列,第二个文件中的三列...
我正在处理蜂巢表,我必须根据地理位置提取数据。我只需要过滤AMER区域的数据,我的意思是列contrycode仅包含一个或任何一个...
我正在处理蜂巢表,我必须根据地理位置提取数据。我只需要过滤AMER区域的数据,我的意思是列contrycode仅包含一个或任何一个...
需要对一列进行groupby添加以获取Hive中另一列的计数
这里是示例数据:在上表中,我们可以看到a1,a2,a3和a4都具有src1。我只需要a3和a4作为结果,因为它们是仅嵌入了src1的仅有的行。 a1和a2 ...
我想提取具有诸如W:X:Y:Z之类的值的列A。我有兴趣从列A中提取Z。我尝试了多个命令,例如SPLIT(Table.A,“ [:]” [3]),但出现错误。什么是...
我的查询:当上(a.camp_name)像“%Event%”和(上(a.camp_name)不像“%Event-WBR%”或上(a.camp_name)像“%Event-Webinar”时的情况%“),然后以“战术”结尾“场”,否则以“需求”结尾...
如果在Hive表/ DataFrame中找不到值,则获取下一个最大值
我有两个Hive表/ Spark数据框A和B A -------- + ---------- + ------ + product |日期| id | -------- + ---------- + ------ + A | 20200201 | X | -------- + ---------- + ------ + B | ...
我是hive的新手,我想实现以下查询,请选择a.controlid,b.name作为广告系列,a.controlactivityid作为活动源,c.code作为codemyaprc,...
Hive表达式不在GROUP BY键'pat_dtl_start_dt'(状态= 42000,代码= 10025)
SQL代码:CREATE TABLE dev.new存储为orc tblproperties(“ orc.compress” =“ SNAPPY”)AS SELECT pat_dtl_start_dt,individual_id,bdy_lctn_cd,prcdr_cd,trtmnt_cd,SUM(allw_amt)来自dev.old GROUP BY ...
HIVE-将select语句的结果作为多个记录插入到hive表中,而不会覆盖现有内容
我从以下命令中得到一张表:CREATE TABLE treatment_costs AS SELECT * FROM(SELECT r。Patient_ID,r.transaction_date,r.paid_transaction_amount,o.dob,o.department_name,o.reason_of_visit ...
我是Hive的新手,遇到了一些问题。我现在正在学习存储桶,我的任务是创建一个包含2个存储桶的Hive表,然后将至少5条记录放入该表中。好吧,那一部分...
我有一个配置单元表作为创建表mySource(col_1 map ,col_2 map ),这里的记录看起来像col_1 col_2 {“ a”:1,“ ...
我有一张客户交易表,客户购买的每件物品都存储为一行。因此,对于单个事务,表中可以有多行。我还有一个叫...
表A --------- col1,col2,Adate,qty表B ------- col2,cost,Bdate表的大小如下:A:100万B:700k考虑此查询:SELECT A.col1,A.col2,B.Bdate bdate,SUM(...
我们使用的是配置单元1.1.0,要求重新排序具有100列的巨大表之一的列,以提高用户的可读性。但是,当我们对表中的列进行重新排序时,其失败并显示以下错误。 ...
如何使用sqoop将数据导出到具有自动增量ID的Microsoft Sql表?
我在Microsoft Sql上有一张表,其中字段ID设置为自动递增。我想将数据从hadoop导出到此sql表。我创建了一个hiveql表来镜像sql表,并尝试设置null ...
我从表中获得此数据:id,uri,date_entered,p_id,ads_id 1,http://vegiefood.com/path1/p.php?keyword = veganway&country = france#Ref1,30 / JUN / 2016,PVEGIEFOOD ,GOOGLEADSENSE 2,http:// ...
我有一个名为“ Scan”客户交易的表,其中对每个不同的交易,一个personal_id都会出现一次,并且包含诸如scan_id之类的列。我还有另一个称为id的表,其中包含...