hiveql 相关问题

Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。

HiveQL:解析字符串和计数

我使用HiveQL以百万计的HDFS中存储的域名的文本数据行的工作。下面是一个手工选择的子集来说明词汇多样性。有重复的条目。 dnsvm ....

回答 1 投票 0

AWS EMR蜂巢:尚不支持地方UDAF“计数”

我有我想转换在与蜂巢使用一个相当复杂的查询。具体地讲,我运行它作为在AWS EMR集群蜂房“步骤”。我试图清理查询了一下的...

回答 1 投票 0

蜂巢/帕拉 - 查找层次结构表中的儿童节点

我有一种情况找到具有parent_node_id层次结构表中的最低一级子节点如下child_node_id。源表是在蜂巢和Impala的数据库。请建议蜂巢/黑斑羚...

回答 1 投票 0

如果存在从蜂巢中选择列

有没有一种方法,以有条件地选择仅在列蜂房存在于每个列?这里是我的伪HQL:SELECT attR1位IF EXISTS,attR2位IF EXISTS,attr3 IF存在于从some_table;如果attR1位&...

回答 1 投票 0

什么是以下字段:“总计TOTALSIZE”和“rawDataSize”意味着DESCRIBE扩展查询输出蜂巢?

如果一个运行在任何蜂巢表说明扩展命令的结果呈现近输出的末尾总计TOTALSIZE和rawDataSize值。做这些字段的含义?例如:蜂巢> DESCRIBE EXTENDED&...

回答 3 投票 7

蜂巢为了通过不可视列

比方说,我有一列,b和c和TEST2与同一列台试验。我可以创建表测试的观点和测试2结合在一起,并从表测试的字段c排序没有显示它...

回答 3 投票 0

有没有办法来改变蜂房查询的默认分隔符

我们通过腻子访问蜂巢,结果将与列由空格隔开(\ 001)。如果数据是零和巨大的表的列数,那么它很难找出哪些列显示...

回答 1 投票 0

我们可以列出了在蜂巢指向表在HDFS的特定位置?

例如:蜂房>节目表,其中位置是“/用户/蜂巢/仓库/数据”;输出示例:样本1(表名)样品2

回答 2 投票 0

为什么蜂巢给metaexception当我试图删除数据库,我使用MySQL作为metastore?

蜂房>> DROP DATABASE IF EXISTS ABC.XYZ;失败:执行错误,从org.apache.hadoop.hive.ql.exec.DDLTask返回码1。 MetaException(消息:一个或多个实例不能...

回答 1 投票 0

如何确定的执行蜂巢查询所需的就业岗位总数

有没有一种方法来识别,以执行查询所需的就业岗位总数。对于在低于2例查询,数量的联接和子查询是相同的,但一个查询需要2个职位,其中为...

回答 1 投票 0

我们能否在蜂巢上的“文本文件”执行CRUD操作

我是一个新手,以Hadoop的,张贴这个问题我已经搜索谷歌和发现只用ORC文件中的所有CRUD操作示例之前。所以想知道,如果我们可以做一个同样的...

回答 1 投票 1

蜂巢 - 拼合层次结构表成水平

我有父子关系最大15级。我需要找出子节点的每个父节点的所有层次结构表。我曾尝试递归查询,但它不是在蜂房的工作...

回答 1 投票 0

如何从表中选择最小值,如果表有两个唯一值的列的其余部分是相同的

例如:输入ID Col1中col2的COL3 - ---- ---- ---- 1 AA SQL 2 AA蜂房停止放ID Col1中col2的COL3 - ---- ---- ---- 1节AA SQL这里我...

回答 2 投票 0

查找蜂房的年度最大出现

这里有一些刷卡记录,我需要找到当年有卡到期日期的最大数量。由于日期是不是在YYYY / MM / DD格式,因此在架构中我已经定义的日期为” ...

回答 1 投票 -1

如何使用ALTER TABLE更改列CASCADE在蜂巢0.13

参照这里ALTER TABLE更改列文件,分区子句是蜂巢0.14可用,CASCADE是在蜂巢1.1.0提供是否有可能更新所有列类型...

回答 1 投票 0

Alteryx是一款优秀的ETL工具

Alteryx是Hadoop数据仓库工具还是ETL流程工具。我的公司正在寻找内置Hive工具的替代品。

回答 2 投票 -1

选择每个月都有记录的所有客户

如何选择每月有记录的所有客户?这里将选择客户,因为他/她每个月都有记录。 + ---------- + -------- + ------- + |客户|日期|花费| + -...

回答 3 投票 0

选择Hive sql中按主键分组的最大日期列的记录

我有一个表如下所示primary_key act_date C1 C2 C3 C4 ... C50 K1 01-12-18 K1 03-12-18 K1 30-12-18 K2 16-11-18 K3 null K4 ...

回答 2 投票 0

如何使用hiveql与上一行日期进行日期差异?

我有一个日期列,我需要使用hive查询与上一行日期做日期差异?

回答 1 投票 0

配置单元中的REGEXP_EXTRACT以获取字符串的子字符串

您好,我是蜂巢的新手,我正在使用regexp_extract从字符串中获取子字符串,我的字符串是'/ abc / def / ghi /',如何使用regexp_extract函数获取abc或def或ghi

回答 3 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.