hiveql 相关问题

Apache Hive数据仓库基础结构中使用的SQL变体。将此标记用于与Hive查询语言相关的问题,包括HiveQL语法和HiveQL特定的函数。

大数据(spark sql和spark dataframes连接)

我是大数据平台的新手。请你让我知道不同的方式。1)我们如何连接到Spark sql的火花?2)我们如何连接到spark数据框或数据集的sparrk? 对于hive,我们...

回答 1 投票 0

无法访问hdp 3中的火花壳。

我自6个月前开始使用hdp 2.4,并根据要求安装了3.0.1,但我不能访问它的旧命令,即不能加载spark-shell hive或Hadoop分布式...。

回答 1 投票 0

| operator:

试图使用regexp_replace掩盖hive中的前6个字符。但是,无法实现解决方案。输入:123-45-6789 输出:##-##-6789 ###-##-6789

回答 1 投票 0

蜂巢中的Vincenty距离

我可以在presto中计算vincenty距离,但是对于我的一个案例,我想计算蜂巢中的vincenty距离。我搜索了一下,但我无法找到任何东西。有什么方法可以...

回答 1 投票 1

学习Mapreduce:到底是reducer做数,还是mapper做数?

在一个mapreduce作业中,包括select count(*) from products where id = 2,count(*)操作发生在哪里,是在mapper还是reducer?

回答 1 投票 0

检查蜂巢中特定位置的特定值。

在Hive中,试图围绕下面的标准检查建立一个逻辑,但无法得出解决方案。标准是如果字符串的第一个位置以9开头,并且在第4个位置上有7或8,那么就只显示最后4位数字,否则返回所有9位数字。

回答 1 投票 1

Hive解析长concat json字符串中的json元素

我有一个服务器日志,它连续记录json值而没有任何定界符,例如:{“ a”:1} {“ b”,2} {“ a”:2} {“ c”:{\“ qwe \“:\” asd \“},” d“:” ert“} {” e“:12}...。我要提取每个元素并放入...

回答 1 投票 0

SQL / HQL如果条件为真,则写入表

是否可以执行类似IF(numRows A> numRows B)的操作,然后将A写入C,其中A,B,C是具有相同模式的表?我正在使用HiveQL。

回答 1 投票 1

同一选择查询中的Hive查询条件语句

是否有一种方法可以获取单个配置单元查询以进行if-else类型的设置。在下面的我的数据中,我想确保如果Model为空或具有'-',请在“ Final”列中填充Device else ...

回答 1 投票 1

如何选择配置单元中所有值,且配置单元中有两列是不同的

我有一个像这样的配置单元表(总共460列)colA colB ....... ce_id文件名......... dt vj 4 gg 40 vj 5 gg ...

回答 1 投票 0

有没有办法在Hive sql中使用OUTER UNION CORR?

我正在尝试通过使用UNION逻辑从四个表创建表,但是所有表的一列都不同。 PROC SQL;创建表output_table从tb1中选择cl1,cl2,cl3 OUTER UNION ...

回答 1 投票 0

在一个键上为NULL,在两个键上为左联接

我正在使用Hive。我想将表A和表B连接起来以获得表C。表A key1 key2名称1 alex 2 a alejandro 4 b xander表B key1 key2问候1 ...

回答 1 投票 -1

配置单元将自动对精度进行舍入

我正在配置单元中进行除法运算,似乎自动将值取整。有没有办法我可以避免这种情况。示例选择cast(600 / 27701.47作为十进制(31,20)); + --------------...

回答 1 投票 1

将Hive查询中的百分位数功能转换为mysql

我正在将对字段(使用percentile(,0.25 ..)函数)进行第25、50和75%百分位计算的配置单元查询转换为mysql查询,并停留在percentile函数上。我尝试过...

回答 1 投票 0

编译语句时出错:失败:SemanticException [错误10002]-使用MAX ON HIVE进行选择

我正在尝试执行此选择以仅返回我正在使用HIVE的最新插入记录co_junta_comer和co_informacao可以重复,但是é需要最新记录select * from ...

回答 1 投票 0

计算往返上下班之间的时间

我想跟踪某人在往返火车上在每个火车站花费的时间。假设我的位置数据是通过不频繁的ping生成的,所以有人可以ping两次或五次...

回答 1 投票 0

分组变量的变化百分比

我有四个分组变量:月份,州,县,市。此外,我还有度量值列销售额,该列可以为空,我想计算每个城市每月销售额的变化百分比。 ...

回答 1 投票 0

配置单元插入覆盖所有分区

[假设,昨天我加载了partition_dates的数据:01-01、02-01至10-01。今天,当我加载数据时,我看到的partition_dates为:01-01、03-01至11-01,表示02-01。分区不可用。 ...

回答 1 投票 0

查询用户出现在表中的前48小时活动(HiveQL / SQL)

我正在使用一个Hive表,该表代表网站上的访问量,并包含诸如user_id,day和event之类的列。我也有一个单独的user_ids列表,我正在尝试为...

回答 1 投票 0

NTILE()如何处理不平衡的数据?

长话短说,我将一些数据分组为不同的段,并注意到在一列中的迁移使用NTILE(10)OVER(ORDER BY column_name DESC)分成了十进制。大约50%...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.