hive 相关问题

Hive是Hadoop的数据仓库系统,可以简化数据汇总,即席查询以及分析存储在Hadoop兼容的分布式文件系统中的大型数据集。 Hive提供了一种机制,用于将结构投影到此数据上,并使用类似SQL的语言HiveQL查询数据。

如何恢复误删除的Hive管理表?

我使用以下sql创建了一个托管表并向其中添加了数据 创建表 test.internal_table ( id 整数, 名称 STRING ); 插入表 test.internal_table 值 (1,“约翰”), (...

回答 1 投票 0

在 Hive 外部表上执行 INSERT INTO 是否也会将行插入底层 HDFS 数据集?

我有一个 Hive 外部表“customer_main”映射到基于 .orc 的 HDFS 数据集,该数据集的路径为“/dev/customer/customer_main/”。如果我运行 INSERT INTO customer_main VALUES() 来插入一行...

回答 1 投票 0

如何在Hadoop Hive中获取Substring?

我的问题是如何通过字符串中的指示获取 Hive 中的子字符串。我的列值格式如下: /国家/州/城市/郊区/街道 在这里我只需要获取国家/地区。 我有喜欢...

回答 2 投票 0

如何通过 pandas 的 parquet 创建 Athena 桌子?

我从 pandas Dataframe 开始并保存为 parquet 格式,如下所示: 将 pandas 导入为 pd df = pd.DataFrame([ {'abc': 1.231, 'xyz':2, 'jkl': False, 'idx': '第一行', '日期': '2023-12-01'}, ...

回答 1 投票 0

将最后一个非空值填充到下一个空行,直到 Hive 中下一个可用的非空值

我的输入数据如下,新的 MD_flag 是基于 md_flag 列 vaue 的输出列。 销售季节|商品|地点|每周|md_flag|新md_flag Q1-23|BP608WZ271812|LBDI|3 月 W5-23|正确|正确 ...

回答 1 投票 0

从 Hive 中的数组<String>中提取最大值

有没有办法从 Hive 中的字符串数组中提取最大值? 我需要在 select 语句中执行此操作,因此不能选择爆炸和连接。 ch = ["4", "9", "1"];

回答 1 投票 0

如何清除Hive并重新初始化它

在我的应用程序中,我使用 Hive 来处理多个对象,并为它们使用多个盒子。 我想知道有没有办法一次性清除所有这些,然后重新初始化蜂巢? 我需要这个来注销我的应用程序...

回答 1 投票 0

如何在 org.apache.hive.jdbc.HiveDriver pyspark databricks 中设置属性

我正在使用 org.apache.hive.jdbc.HiveDriver 从配置单元读取数据,我试图传递此属性: hive.resultset.use.unique.column.names = false 在配置字典中: jdbc_url = f"jdbc:hiv...

回答 1 投票 0

获取字符串中相同输入旁边的最大值

我正在开发 Hive: 我有以下字符串: D.07.01.01=1;B=NUL;A=NUL;D.07.01.01=NUL;R=1;D.07.01.01=2;D.07.01.08=2;D.07.01.07= 1;D.07.01.06=2;D.07.01.05=1;D.07.01.04=2;D.07.01.03=1;F=是;D.07....

回答 1 投票 0

如何在hive中添加jar文件

我尝试使用ADD JAR hive-contrib-0.10.0.jar命令在hive中添加hive-contrib-0.10.0.jar,但它总是说hive-contrib-0.10.0.jar不存在。 我现在使用的是 HDP 2.1 版本。我...

回答 5 投票 0

Hive sql 分区

我有一列用于 row_number() over (partition...) row_number() OVER (分区 BY customer_id ORDER BY order_date, order_number) AS order_row, 和另一列计算“累积...

回答 1 投票 0

使用 SparkSQL 时 PARTITION BY 的“RANGE BETWEEN”问题

当我尝试在sparkSQL中使用PARTITION BY时,我遇到了这个复杂的查询: 对于当前的每一行,使用 user_id,product_id,[create_date-3day,create_date+3day] 作为数据窗口,做一些数据查询...

回答 2 投票 0

`spark.sql.sources.schema`表属性是什么意思?

我最近在 ETL 代码中遇到了一个错误,我已经确定了它的根本原因,我知道它与名为 Spark.sql.sources.schema 的属性有关,但我想了解更多信息.. .

回答 1 投票 0

如何在 Hive 或 Presto 中将以下字典格式列转换为不同格式?

我有一个 Hive 表,如下所示: 事件名称 每个国家的与会者人数 A {'美国':5} 乙 {“美国”:4,“英国”:3,“加拿大”:2} C {'英国':2,'加拿大':1} 我想得到一个如下所示的新表: 国家 人数...

回答 2 投票 0

Flutter andriod中如何或在哪里存储FCM后台通知数据到Hive中?

我正在开发一个需要在后台运行时存储通知的应用程序。我尝试使用放入存储模块来保存通知,但当应用程序处于

回答 1 投票 0

hive 在分区表上添加列不起作用

我分享在分区 Hive 表上添加列的经验。 正如您所看到的,尽管有 CASCADE 功能,但 ALTER 会破坏我的表:( 在分区表上添加列 表格描述...

回答 2 投票 0

SQL 查询将具有多个状态更改日期列的单行转换为具有状态和时间戳的多行

我的输入数据如下: 故事ID || sched_state ||故事_being_groomed_ts || Story_def_ts || Story_in_prgrs_ts ||故事_cmpl_ts || =================================================== =====...

回答 1 投票 0

无法运行配置单元

尝试运行配置单元但当前收到此错误。错误尝试将此行 hive-site.xml 添加到我的 hive-site.xml 但我仍然得到相同的“HiveConf 名称 hive.server2.enable.imperson...

回答 1 投票 0

从远程 Spark 连接到 Hive 元存储

我有安装了 hive 和 Spark 的 hadoop 集群。此外,我有一台单独的工作站计算机,我正在尝试从它连接到集群 我在这台机器上安装了 Spark 并...

回答 1 投票 0

为 HIVE 中现有的物理列创建分区

是否可以创建一个分区列作为HIVE中表列之一的表? 例如:创建表 test (a int, b string, c int),由 (c int) 分区 当运行上面的代码时,它会......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.