hive 相关问题

Hive是Hadoop的数据仓库系统,可以简化数据汇总,即席查询以及分析存储在Hadoop兼容的分布式文件系统中的大型数据集。 Hive提供了一种机制,用于将结构投影到此数据上,并使用类似SQL的语言HiveQL查询数据。

我想将枚举设置为“冻结”的属性并使用扩展吸气剂,但我无法使用它

我已将作为枚举创建的对象设置为使用“冻结”创建的不可变对象的属性。此外,我还创建了一个扩展枚举对象的对象。虽然我预计它会起作用

回答 1 投票 0

Hive 无法创建 Spark 会话

我尝试了很多,阅读了很多spark和hive的文档。事情甚至不相符。例如 https://cwiki.apache.org/confluence/display/Hive/Hive+on+Spark%3A+Getting+Started 在 hive 的文档中...

回答 1 投票 0

应用程序重新启动时,hive 数据会重置

我已将数据存储在 Hive 框中,但每当我重新启动应用程序或在离线模式下终止应用程序时,即当互联网连接不存在时,数据就会重置并显示空错误。 等待蜂巢。

回答 2 投票 0

Hive 中的 Presto UNNEST 函数相当于什么

Presto 有一个 UNNEST 函数来分解由数组组成的列。 Hive 有类似的吗? 请参阅此处有关 Presto 的 UNNEST 功能的文档。

回答 1 投票 0

即使将“orc.force.positional.evolution”设置为 false hive 仍然会根据位置进行拾取

我有一个外部表,我在其中添加了一些新列,并希望确保orc格式文件中的数据应根据列名称从Spark数据帧写入Hive外部表...

回答 1 投票 0

获取每个月的最大日期

我正在尝试使用 SQL Hive 从数据库列中获取每个月的最大日期。 我有一张表如下: 年月日 2020-05-01 2020-05-10 2020-05-20 2020-05-27 2020-06-03 2020-06-12 2...

回答 1 投票 0

在 Hive SQL 中使用 Partition By 根据日期比较值

我有一个名为推荐的表 创建表 [数据产品].[推荐] ( [person_id] 双, [medical_service_cd] 双倍, [refer_from_organization_id] [referral_org_name] S...

回答 1 投票 0

使用 pyspark 和 Java 在元字符 * 处进行 Split()

我一直在与此代码作斗争,将列 name_surname 拆分为 2 个不同的列。 name_surname 列的内容存储方式如下:David*Green,因此这些查询的目的是搜索...

回答 1 投票 0

Hive 查询将日期时间戳转换为日期格式

我想使用 hive 查询将包含“4/12/2023 15:37”等值的日期时间戳列转换为日期格式:2023-12-04。 to_date 格式只给我空值。

回答 1 投票 0

在 Hive 表中拆分单词

我是新来的 我正在尝试使用 Apache hive 对推文进行分析。 我能够在 csv.file 中检索推文 然后我简单地创建一个表 如果外部表不存在,则创建 tweets3 ( id bigint...

回答 1 投票 0

Hive 数据未更新

这是我初始化 Hive 的函数,如果它是空的,则在其中放入一些虚拟数据,但是数据没有显示,我发现它甚至没有在热时被调用

回答 1 投票 0

如何使用非唯一ID投保?

我正在 hive 中做一个请求。我的任务是在创建后的两周内将两个表与保险单连接起来。我有一个非唯一的关键人物编号(一个人的 ID),它有多个记录......

回答 1 投票 0

使用 HIVE,我需要找到特定 ID 的第一个 IN 和同一会话的最后一个 OUT,而不是当天的最后一个 OUT

我有这样的数据: +------+----------+---------+---------+------------ --------+----+----------+ |身份证 |打孔日期|打孔类型|打孔时间|打孔日期时间|呜呜|饲料日期| +------+---------...

回答 1 投票 0

Apache IceBerg 缺少 hive 依赖问题

我正在尝试使用 Apache IceBerg 将数据写入指定位置(S3/本地)。以下是下面使用的配置。 科学技术试验: 库依赖项 +=“org.apache.spark”%%“spa...

回答 3 投票 0

Flutter - 将 Hive 数据与服务器同步

目前我正在使用Hive进行Flutter编码,将数据存储在本地,不知道Hive(已离线修改)和服务器上的数据如何同步。 目前,我...

回答 1 投票 0

哪个 current_date 函数适用于 impala 和 trino?

trino - 从员工中选择cast(date_format(current_date,'Y%M%D') as int); impala - 从员工中选择cast(from_timestamp(now(),'YYYMMDD') as int); 有什么功能可以在...

回答 2 投票 0

在“spark-defaults.conf”中设置属性“spark.sql.hive.metastore.jars”后出现异常

下面给出的是我在系统中安装的 Spark 和 Hive 的版本 火花:spark-1.4.0-bin-hadoop2.6 配置单元:apache-hive-1.0.0-bin 我已将 Hive 安装配置为使用 MySQ...

回答 2 投票 0

HIVE 重命名带有分区的表中的列

这是hive中带有分区的表 我试过: ALTER TABLE 表名 CHANGE COLUMN 旧名称 新名称 语法:Hive 风格的 ALTER COLUMN 不支持重命名列,请运行 RENAME COLUMN

回答 1 投票 0

如何查找特定列的第一个 IN 和最后一个 OUT?

我有一个包含列事件的表。它有 IN 和 OUT 等数据。 现在我需要创建两列,其中包含特定 ID 的第一个 IN 的时间和同一 ID 的最后一个 OUT 的时间。 我需要...

回答 2 投票 0

为嵌套 JSON 数据创建 Hive 表

我无法将嵌套的 JSON 数据加载到 Hive 表中。以下是我尝试过的: 输入示例: {"DocId":"ABC","User1":{"Id":1234,"用户名":"

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.