hive 相关问题

Hive是Hadoop的数据仓库系统,可以简化数据汇总,即席查询以及分析存储在Hadoop兼容的分布式文件系统中的大型数据集。 Hive提供了一种机制,用于将结构投影到此数据上,并使用类似SQL的语言HiveQL查询数据。

SQL/Hive 计算不同列

如何在 SQL/Hive 中执行此操作? A 列 B 列 C 列 100.10 50.60 30 100.10 50.60 30 100.10 50.60 20 100.10 70.80 40

回答 3 投票 0

hive 中的原始 json 字段类型

如何使用原始json字段在hive中定义表(不解析,作为纯文本)? 对于以下 s3 文件: {“first_field”:1,“json_field”:{“a”:{“b”:“c”},“d”:“e”},“sec_field”:4} {“第一个字段...

回答 1 投票 0

Flutter 如何在终止任务后使用 Hive 管理 ListView 的状态?

我正在尝试开发一个书签应用程序,您可以添加和删除项目。我正在使用 Hive 来管理 ListView 上项目的状态,但它没有按我的预期工作。我的期望是这些物品

回答 1 投票 0

如何将 pandas 数据帧写入使用 Kerberos 身份验证的 HIVE 数据库

我找不到好的源代码来尝试将本地计算机上的 pandas 数据框写入 hadoop 集群的 HIVE 数据库。 我可以查询表并将其转换为 pandas 数据框

回答 1 投票 0

有和没有时间分区条件的两个 Hive 查询之间的结果差异

我有两个针对表运行的 Hive 查询,并且得到不同的结果,但我不完全确定原因。我想了解这种差异的原因。 查询1: 选择

回答 1 投票 0

当字段为空/null时如何获取该字段的前一行值

我有交易表,数据如下。 acct_updt_tm 帐户 ID acct_eff_dt acct_cncl_dt acct_canc_cd 2023-10-24 9873456 2023-10-14 9873456 2020-06-11 2023-12-01 01 2023-10-24 5567341 20...

回答 1 投票 0

在 Spark scala 中处理小数值

我的文件中有数据,如下所示: 7373743343333444。 7373743343333432。 该数据应转换为十进制值,并且应位于 8.7 的位置,其中 8 是小数点前的数字...

回答 2 投票 0

如何解决HIVE中的时间戳代码错误

这里需要帮助。 我在 Impala 中运行下面的代码没有问题,但是当我在 Hive 中运行相同的代码时,它会出现错误消息。 任何人都可以帮助修改代码,以便我能够在 HIVE 中运行。 比...

回答 1 投票 0

使用 Hive 和 Flutter 来存储待办事项列表

我是一个完全不懂扑通扑通的菜鸟,所以这个对你来说可能很容易。我正在尝试将 Hive 集成到我的应用程序中,以便我可以在本地存储信息。但是,我不确定我会如何做到这一点。这我...

回答 1 投票 0

查询表时Hive日期显示为NULL

我在 Hive 中有一个表,其中包含日期数据类型的字段。表是一个外部表,文本文件“04/14/2006 00:00:00”中的日期值如下,当我查询表时,我得到 NULL...

回答 2 投票 0

如何在没有 hive-site.xml 的情况下将 Spark SQL 连接到远程 Hive 元存储(通过 Thrift 协议)?

我将 HiveContext 与 SparkSQL 结合使用,并且尝试连接到远程 Hive 元存储,设置 Hive 元存储的唯一方法是在类路径中包含 hive-site.xml (或复制...

回答 11 投票 0

Windows 注册表配置单元文件文档

我需要一份描述 Microsoft Windows 注册表配置单元文件格式的文档。我唯一能找到的就是这个: http://www.sentinelchicken.com/data/TheWindowsNTRegistryFileFo...

回答 2 投票 0

HIVE 中的拆分功能

我想将地址分成两列,即街道编号和街道名称,例如 从客户处选择地址1 前任的地址看起来像 第2719章 并将它们存储到街道号 2...

回答 1 投票 0

Pyspark 中的表显示 CSV 文件中的标题

我有一个 csv 文件,其内容如下,第一行有一个标题。 身份证号、姓名 第1234章 第8984章 现在我可以在配置单元中创建一个表来跳过标题并适当地读取数据。

回答 3 投票 0

如何在pyspark中读取hive表和元数据?

我无法使用 pyspark 读取 Hive 表及其元数据 我认为我正在准确地创建配置单元表 设置: 从 pyspark.sql 导入 SparkSession 从 pyspark.sql 导入函数...

回答 1 投票 0

HiveError:“recipebox”框已打开且类型为 Box<Recipe>

我需要帮助。 导入'dart:转换'; 导入“包:flutter/material.dart”; 导入'包:flutter/services.dart'; 导入'包:flutter_riverpod / flutter_riverpod.dart'; 导入'包:hive_fl...

回答 1 投票 0

hive 扁平化 JSON 字符串

我正在尝试转换存储在 hive 表中的以下 json 字符串。 输入: COL1 JSON_STRING 1 {"COL2": {"REFA": "9", "REFB": "9"}, "COL3&q...

回答 2 投票 0

SQL 正则表达式组

我在使用 regexp_extract 与 Hive 配合使用时遇到问题。问题似乎与分组有关。我基本上是从 / 字符之间的 URL 中提取信息,我想选择 no...

回答 1 投票 0

“信息:Tez 会话尚未创建。正在打开会话”挂起

我正在使用 HDP 2.3.0.0-2557,我正在尝试运行如下所示的配置单元查询: 直线> !connect jdbc:hive2://localhost:10000 连接到 jdbc:hive2://localhost:10000 输入用户名...

回答 2 投票 0

Hive 数据存储在哪里?

我对配置单元在哪里存储数据有点困惑。 它将数据存储在 HDFS 还是 RDBMS 中? Hive Meta 存储是否使用 RDBMS 来存储 Hive 表元数据? 谢谢

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.