hive 相关问题

Hive是Hadoop的数据仓库系统,可以简化数据汇总,即席查询以及分析存储在Hadoop兼容的分布式文件系统中的大型数据集。 Hive提供了一种机制,用于将结构投影到此数据上,并使用类似SQL的语言HiveQL查询数据。

升级后连接到配置单元中的Metastore

我最近将我的Hive从v1.2更新到v2.1。现在我每次登录时都会直接连接到默认的hive Metastore(metastore_db),而不是我的thrift Metoreore端口(https:// localhost:9083)......

回答 1 投票 0

亚马逊EMR火花上的蜂巢

我在hive上尝试了以下命令:set hive.execution.engine = spark;但是在我在amazon EMR上设置执行引擎后运行任何查询时出现错误:线程“main”中的异常java.lang ....

回答 2 投票 2

无法将Sentry与Hive绑定

这篇文章是关于绑定Sentry与Hive。我一直面对这个问题。我的主要目标是提供对创建时具有权限的数据库和表的访问权限......

回答 1 投票 0

如何插入带有镶木地板格式和SNAPPY压缩的蜂巢表?

Hive 2.1我有以下表定义:CREATE EXTERNAL TABLE table_snappy(一个STRING,b INT)PARTITIONED BY(c STRING)行格式SERDE'org.apache.hadoop.hive.ql.io.parquet.serde ....

回答 1 投票 0

有没有人有一个hive错误代码列表?

有没有人有蜂巢错误代码列表?例如,如果我们在配置单元中找到一个未找到表的错误,则为“echo $?”的值将是17。

回答 1 投票 3

运行HIVE命令抛出错误:线程“main”中的异常java.lang.RuntimeException:org.apache.hadoop.hive.ql.metadata.HiveException

我已根据此链接在我的Ubuntu机器上完成了HIVE设置。当我运行HIVE命令(最后一步)时,我得到以下异常:SLF4J:类路径包含多个SLF4J绑定。 SLF4J:发现......

回答 2 投票 0

Hive查询regexp_extract失败

我正在尝试使用regexp_extract从我的表中的列(字符串数据类型)中提取我所需的数据,我使用此查询:select regexp_extract(concat(column_name ,;),'。* a2 =?(。*?); ',1)来自表格; ...

回答 2 投票 0

如何将字符串转换为hive中的struct数组并进行爆炸?

我在hive中有以下格式的数据。表测试(seq字符串,结果字符串); | seq |结果......

回答 2 投票 1

将时间戳舍入到蜂巢中的小时

如果我们在列中有时间戳,例如'2018-01-01 01:35:00.000'。我想将时间戳舍入为小时,并将值设为'2018-01-01 01:00:00.000'。

回答 2 投票 0

如何编写基于另一个表过滤表的Hive查询?

我有两个表,表一有两列a和b,表二有两列c和d。对于表一中的每一行,如果我能在表二中找到一行,那么a = c和子串(b,1,3)= ...

回答 1 投票 0

我在计算Hive的中位数时出错了

我的Hive表目前看起来像这样:数字0 0 -0.12745098 -0.218905473 0.026011561 0.235294118 -0.028 -0.052356021 0.052753355 0.008032129 0.012768817 0.115384615 0.040816327类型是......

回答 2 投票 0

如何将SQL数据加载到Hortonworks中?

我在我的电脑上安装了Hortonworks SandBox。还尝试了一个CSV文件,它以一个表格结构的方式获得它的OK(Hive + Hadoop),我想将我当前的SQL Databse迁移到Sandbox(...

回答 2 投票 4

引起:java.lang.OutOfMemoryError:超出GC开销限制

你能帮我解决一下GC开销错误吗?背景:这是一个pig脚本,通过HCATALOGUE从4个hive表加载数据。蜂巢表是序列文件和...

回答 1 投票 0

Hive - 如何通过列A和B以及不同的列C组合组

我需要创建一个查询,从特定的表中选择具有多个不同电子邮件的用户。为了区分用户,我根据两个字段对它们进行分组:名称和年龄。我们来看看......

回答 1 投票 2

hive ngram使用什么分隔符来标记化?

我正在进行一些情绪分析。我需要在文本中计算词汇(不同的单词)。 ngram UDF似乎在确定unigrams方面做得很好。我想知道...

回答 1 投票 0

计算Hive中计数器数据的差异

我有计数器数据存储在Hive表中。计数器在时间上递增,有时会重置为零。我想计算连续行之间的差异,但是在计数器重置的情况下......

回答 1 投票 0

如何使用配置单元简化计算效率?

代码在hive上运行:select day,count(mdn)* 5作为数字来自(选择不同的a.mdn,a.day来自流程a.day = date_add的左外连接流b(b.day,-1) )和a.mdn = b.mdn左外连接流c ...

回答 1 投票 1

在Hive中合并整数数组

foo_ids是bigint类型的数组,但整个数组可以为null。如果数组为null,我想要一个空数组。如果我这样做:COALESCE(foo_ids,ARRAY())我得到:失败:......

回答 1 投票 2

仅在Hive中打印表头

是否可以在没有表名前缀的Hive中打印标题?我做了:设置hive.cli.print.header = true;然后:从品牌限制3中选择*;结果是:brands.id brands.name品牌....

回答 1 投票 1

Bash文本解析HIVE DDL

我有重复的下面的文本组,它基本上是来自2个hadoop hive表table1和table2的描述扩展输出并显示其属性。详细的表信息表(...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.