cloudera 相关问题

Cloudera Inc.是一家位于Palo Alto的企业软件公司,提供基于Apache Hadoop的软件和服务。

无法在Cloudera Quickstart VM(5.10)中安装spark 2.2

我在这里关注了博客(下面提到的)并下载了包裹并按要求放置。如果安装了任何人和步骤,请告诉我。 (HTTPS://www.cloudera.com/documentation / ...

回答 4 投票 3

使用带有python的livy时,响应状态对象'死'

我正在尝试使用livy,这是我第一次使用REST api。在本教程之后,当我输入r = requests.post(statements_url,data = json.dumps(data),headers = headers)然后输入r.json()...

回答 3 投票 0

Cloudera Impala INVALIDATE METADATA

正如在impala教程中讨论的那样,Impala使用Hive共享的Metastore。但是有人提到如果你使用hive在表上创建或做一些版本,你应该执行INVALIDATE ......

回答 3 投票 5

使用Java在单个语句中运行多个Hive查询时出错

我正在运行此查询:设置hive.limit.query.max.table.partition = 9000;选择不同的ps169作为hotel_code,pd5作为city_code,datediff(to_date(pd32),to_date(FROM_UNIXTIME(UNIX_TIMESTAMP())))作为ap1 ...

回答 2 投票 2

有没有办法将节点添加到正在运行的Hadoop集群?

我一直在玩Cloudera,我在开始工作之前定义了簇的数量,然后使用cloudera管理器确保一切都在运行。我正在开发一个新项目......

回答 5 投票 14

hadoop,python,subprocess失败,代码为127

我正在尝试使用mapreduce运行非常简单的任务。 mapper.py:#!/ usr / bin / env python导入sys.stdin中的行sys:print line my txt file:qwerty asdfgh zxc运行作业的命令行:...

回答 3 投票 3

列名称中的空格抛出异常,而镶木地板用于压缩

将数据插入到具有空格的列名称的镶木地板格式表中时,我遇到错误。使用Cloudera版本的Hive客户端CREATE TABLE testColumNames(First Name string)...

回答 2 投票 1

HDFS作为cloudera quickstart docker中的音量

我对hadoop和docker都很新。我一直在努力扩展cloudera / quickstart docker image docker文件,并希望挂载目录表单主机并将其映射到hdfs位置,...

回答 2 投票 4

连接到Hive从远程计算机上的R启用了Kerberos

我在我的本地机器上运行了一个R,我的蜂巢服务器在使用cloudera的aws机器上配置并启用了kerberos。我现在无法使用...从本地R实例连接到hive服务器

回答 1 投票 1

时间戳减少了插入覆盖中的小时

我一直在使用Sqoop,hive和Impala。我的Sqoop作业从SQL Server获取一个字段为datetime的字段,以写入存储为textfile的TABLE1。 TABLE1中的字段具有时间戳格式....

回答 1 投票 0

Oozie + Sqoop:JDBC驱动程序Jar位置

我有一个基于6节点cloudera的hadoop集群,我正在尝试从oozie中的sqoop操作连接到oracle数据库。我已将我的ojdbc6.jar复制到sqoop lib位置(对我来说......

回答 4 投票 5

用于处理小消息文件的技术堆栈

我们正在一个项目中解码实时消息文件,这些文件以文本文件的形式传输给我们。该文件是非结构化文本,但我们有一个规范来解码它。有 ...

回答 1 投票 -1

HBase:如何更改表的memstore?

我们要求在第0天我们将运行历史火花作业以将批量数据加载到HBase中。每天发布,我们只会将结束日数据添加到HBase。要处理这个......

回答 1 投票 0

差异b / w Mapr和Cloudera?

Cloudera是免费版和企业版,但MapR几乎是企业版的原因么?它们之间有什么重大区别吗?

回答 2 投票 0

Hive - 巨大的10TB表重新分区(添加新的分区列)

技术人员,背景 - 我们有10TB现有的蜂巢表,它在A列上进行了范围分区。业务案例有变化,现在除了A列之外还需要添加分区列B.

回答 1 投票 0

Cloudera CDH 5.13 - 是否可以在Yarn模式下运行spark 2.x?

团队,在我的本地计算机上安装了CDH 5.13版本,并从spark 1.6升级到spark 2.0。是否可以使用纱线模式运行火花应用。请确认 。或者它将起作用......

回答 1 投票 -1

在scala中使用split()方法中的单引号和双引号有什么区别?

我正在研究cca-175练习题。给我一个文本文件,由|分开:Christopher | 2015年1月11日,| 5 Kapil | 2015年1月11日| 5 Thomas | 2014年6月17日| 5 John | 22-08-2013 | 5 Mithun | 2013 | 5 ...

回答 2 投票 0

直线无法连接到hiveserver2

我有一个CDH 5.3实例。我首先启动hive-metastore,然后从命令行启动hive-server,启动hive-server2。在此之后我使用beeline连接到我的hive-server2但是...

回答 7 投票 9

kafka集群中的Kafka管理器配置问题

我试图在我的kafka集群中安装和配置kafka管理器,但在构建kafka manager二进制文件时面临问题,如下所示。 ./sbt clean dist。服务器没有连接互联网,所以不...

回答 1 投票 0

计算每行的单词数

我正在尝试使用sparklyr将R代码移动到spark中,我遇到了一些函数的麻烦,以便执行以下操作:-Count连续的单词总数:例如......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.