hive 相关问题

Hive是Hadoop的数据仓库系统,可以简化数据汇总,即席查询以及分析存储在Hadoop兼容的分布式文件系统中的大型数据集。 Hive提供了一种机制,用于将结构投影到此数据上,并使用类似SQL的语言HiveQL查询数据。

Apache Hive 中的 DECIMAL 是固定长度类型吗?

在 Apache Hive 中如何获取 DECIMAL 的长度,如果它是固定长度类型,例如 16 字节或不是? 我没有在文档中找到信息,如果它有一些方法来获取长度,比如...

回答 1 投票 0

HiveAccessControlException 权限被拒绝:用户没有 [ALL] 权限

我对 hive 和 hadoop 生态系统非常陌生。 我正在尝试在配置单元中创建一个新表,但遇到此错误: 根据一些建议,我必须设置 Ranger 策略,但基于

回答 2 投票 0

PySpark:MutableLong 无法转换为 MutableInt(数据帧中没有 long)

我正在尝试使用 boto3 中的 Glue 客户端从 PySpark 中的 Athena 读取配置文件表,并检查它是否为空。为什么 Spark 在将 Int 转换为 Long 时出现错误,知道我没有 Long 类型......

回答 1 投票 0

指定的分区列与表的分区列不匹配。请使用()作为分区列

这里我试图将数据帧持久保存到分区的配置单元表中并得到这个愚蠢的异常。我已经检查过很多次了,但找不到问题所在。 org.apache.spark.sql.

回答 1 投票 0

Hive中的decimal是定长类型吗?

Hive中如何获取小数的长度,如果是固定长度类型,比如16字节或者不是。 文档中没有找到信息,如果有一些方法可以获取长度,比如一些函数,我...

回答 1 投票 0

col计数时无法选择大小写

这是我写的sql查询, 选择 COUNT(*) AS TOTLA_COUNT, 数数( 案件 当 ( market_val > 0 AND ABS(loan_amt / market_cal * 100 - 比率 ) > 5 ) THEN 1 ...

回答 1 投票 0

Hive“从表名中选择 to_date(第 2 列)”

我有以下表格结构: 表名:测试 表结构:这里的col1和col2是字符串。 第 1 列 列2 “abc” “2016 年 4 月 15 日” “定义” “2016 年 5 月 31 日” 什...

回答 1 投票 0

如何更新/删除 Hive 分区?

在 Hive 中向外部表添加分区后,如何更新/删除它?

回答 6 投票 0

在CentOS7中启动mysql,无法启动mysql.service: Unit not found

当我输入命令时: 在CentOS7中systemctl启动mysql,我收到以下消息: 无法启动 mysql.service:找不到单元 感谢您的帮助。

回答 4 投票 0

如果行号按 A 列计数 >1 进行分区,则填充特定 B 列的空值

部门表包含部门ID和部门名称。当同一部门 ID 多次出现时,需要将名称填充为 null。 部门名称 200 ABC 200 XYZ 100防御 输出 南部...

回答 1 投票 0

Spring boot api

如何编写 Spring Boot API 来检索 Hive 数据库中已存在的数据并查询数据表中存在的 device_id 并作为 JSON 响应返回并包括 swag...

回答 1 投票 0

Hive 对分区进行计数,以防万一

我有两个疑问: 从 t1 中选择 count(*) over (按 col1 分区) 和 选择当 count(*) over (partition by col1) >1 then 1 else 0 t1 结束时的情况 第一个工作正常。第二个

回答 1 投票 0

如何在presto中有效地选择按年月日分区的2个日期之间的数据?

有一个表,其中有 y(年)、m 月、d(日)列。如何在2个日期之间选择查询?喜欢: select * from my_table where y m d 介于“2018-12-01”和“2021-01-01”之间 她有两个问题...

回答 2 投票 0

Apache Hive - 编程上相同的查询但结果不同,为什么?

我有2个表Table1有41列和超过1亿条记录,Table2有20列和1000万条记录。 我使用以下查询来验证记录。 查询01。 选择计数(*) FROM

回答 1 投票 0

Dbeaver 异常:数据源无效

我正在尝试使用 Dbeaver 并通过 Spark Hive 处理数据。当以下命令有效时,连接稳定: select * from database.table 限制 100 然而,一旦我有不同意见...

回答 1 投票 0

如何在同一个SQL查询中获取总计数和带条件的计数?

我有一张这样的桌子: ID 价值 0001 0 002 100 我想制作一个这样的表: 总数 失败计数 通过率 2 1 0.5 我可以知道如何在一个 Hive SQL 查询中编写吗?谢谢。 pass_r...

回答 1 投票 0

在 Hive 中从 DynamoDB 创建外部表失败,并显示“不支持的 Hive 类型:int”

我正在尝试使用以下命令从 DynamoDB 在 Hive 中创建外部表: 创建外部表 StoreData(rowid INT, order_priority STRING, 折扣 FLOAT、单价 FLOAT、运费 F...

回答 1 投票 0

如何从 Hive 外部 Druid 表中排序查询结果?

首先,我对 hive 和 druid 还比较陌生。 我已经设置了一个连接到 Druid 数据源的 Hive 外部表。我可以像查询简单的 SELECTS 一样。例子: 选择我...

回答 2 投票 0

在蜂巢中查找排名

我有一组数据 亚历克斯,50 阿努, 85 利米, 41 萨姆,56 我需要找到学生的排名并将其存储在带有排名的另一列中 例如:- 亚历克斯 50 3 阿努 85 1 利米 41 4 萨姆 56 2...

回答 1 投票 0

Hive 中的特定列不同

我正在运行 Hive 071。 我有一个表,有多行,具有相同的列值。 x| y | --------- 1 | 2 | 1 | 3 | 1 | 4 | 2 | 2 | 3 | 2 | 3 | 1 | 我想让 x 列独一无二,...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.