hive 相关问题

Hive是Hadoop的数据仓库系统,可以简化数据汇总,即席查询以及分析存储在Hadoop兼容的分布式文件系统中的大型数据集。 Hive提供了一种机制,用于将结构投影到此数据上,并使用类似SQL的语言HiveQL查询数据。

当 hive.execution.engine 设置为 MR 时,Hive 查询失败,当设置为 Tez 时,它们可以工作?

我在工作中使用 HDP 2.1 沙箱。 jar 文件列出的 hive 版本为:hive-exec-0.13.0.2.1.1.0-385.jar。 我在 HDFS 中创建了一个包含天气信息的目录。实际的

回答 1 投票 0

将微观策略连接到 Hive

我无法将微观策略连接到 Hive。 我已遵循这里的每一条指示 我也阅读了微观策略的技术说明。我可以成功连接到端口 8020,但是当我...

回答 2 投票 0

从hdfs加载数据到HIVE错误路径未找到

我面临着一个我不知道如何解决的问题。 我已将 csv 文件上传到路径 /user/oscarvicenteremonhotmail/StockPrices.csv 和 /user/oscarvicenteremonhotmail/hdfshive/

回答 1 投票 0

如何在Hive中存储列表? - 颤动

我正在构建一个体验应用程序。我正在尝试将列表存储在配置单元中。那么,谁能解释一下如何在配置单元中存储列表? 在下面的列表中,存储了所有数据。我想存储这些数据...

回答 2 投票 0

连接外部和内部表时 hive 失败

我们的环境/版本 Hadoop 3.2.3 蜂巢3.1.3 火花2.3.0 我们在 hive 中的内部表定义为 创建表 dw.Client ( client_id 整数, client_abbrev 字符串, 客户名称字符串,

回答 2 投票 0

从 jupyter 笔记本运行 impala-shell

我正在尝试从 jupyter-notebook 运行 impala,如下所示-- 从 impala.dbapi 导入连接 conn = 连接(主机='xx-xx-xx.xx.com', 端口=21000, auth_mechanism =“...

回答 1 投票 0

如何在hive表中加载csv文件?

我在 hive 中创建表并从 hdfs 加载 csv 文件,但是当尝试对创建的表执行选择查询时,我得到加密格式的结果,您能否为此提供解决方案。 cr...

回答 1 投票 0

如何使用 hive sql 查询查找表中不存在的行?

我的数据是这样的: ID 阶段1 第二阶段 1 A F 1 乙 G 1 C H 2 A F 2 乙 G 2 C H 3 A F 3 乙 G 4 A F 4 乙 G 我想找到 Stage_1 = A 存在但 Stage_2 = ... 的唯一 ID 的数量

回答 2 投票 0

Windows MIT Kerberos,错误 1765328190,krb5_cc_set_flags

在测试与 HIVE 的 ODBC 连接期间,我遇到了 MIT Kerberos 错误 凭据缓存权限不正确(Kerberos 错误 -1765328190) krb5_cc_set_flags 失败 你如何解决这个问题? ...

回答 2 投票 0

我想将枚举设置为“冻结”的属性并使用扩展吸气剂,但我无法使用它

我已将作为枚举创建的对象设置为使用“冻结”创建的不可变对象的属性。此外,我还创建了一个扩展枚举对象的对象。虽然我预计它会起作用

回答 1 投票 0

Hive 无法创建 Spark 会话

我尝试了很多,阅读了很多spark和hive的文档。事情甚至不相符。例如 https://cwiki.apache.org/confluence/display/Hive/Hive+on+Spark%3A+Getting+Started 在 hive 的文档中...

回答 1 投票 0

应用程序重新启动时,hive 数据会重置

我已将数据存储在 Hive 框中,但每当我重新启动应用程序或在离线模式下终止应用程序时,即当互联网连接不存在时,数据就会重置并显示空错误。 等待蜂巢。

回答 2 投票 0

Hive 中的 Presto UNNEST 函数相当于什么

Presto 有一个 UNNEST 函数来分解由数组组成的列。 Hive 有类似的吗? 请参阅此处有关 Presto 的 UNNEST 功能的文档。

回答 1 投票 0

即使将“orc.force.positional.evolution”设置为 false hive 仍然会根据位置进行拾取

我有一个外部表,我在其中添加了一些新列,并希望确保orc格式文件中的数据应根据列名称从Spark数据帧写入Hive外部表...

回答 1 投票 0

获取每个月的最大日期

我正在尝试使用 SQL Hive 从数据库列中获取每个月的最大日期。 我有一张表如下: 年月日 2020-05-01 2020-05-10 2020-05-20 2020-05-27 2020-06-03 2020-06-12 2...

回答 1 投票 0

在 Hive SQL 中使用 Partition By 根据日期比较值

我有一个名为推荐的表 创建表 [数据产品].[推荐] ( [person_id] 双, [medical_service_cd] 双倍, [refer_from_organization_id] [referral_org_name] S...

回答 1 投票 0

使用 pyspark 和 Java 在元字符 * 处进行 Split()

我一直在与此代码作斗争,将列 name_surname 拆分为 2 个不同的列。 name_surname 列的内容存储方式如下:David*Green,因此这些查询的目的是搜索...

回答 1 投票 0

Hive 查询将日期时间戳转换为日期格式

我想使用 hive 查询将包含“4/12/2023 15:37”等值的日期时间戳列转换为日期格式:2023-12-04。 to_date 格式只给我空值。

回答 1 投票 0

在 Hive 表中拆分单词

我是新来的 我正在尝试使用 Apache hive 对推文进行分析。 我能够在 csv.file 中检索推文 然后我简单地创建一个表 如果外部表不存在,则创建 tweets3 ( id bigint...

回答 1 投票 0

Hive 数据未更新

这是我初始化 Hive 的函数,如果它是空的,则在其中放入一些虚拟数据,但是数据没有显示,我发现它甚至没有在热时被调用

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.