cloudera 相关问题

Cloudera Inc.是一家位于Palo Alto的企业软件公司，提供基于Apache Hadoop的软件和服务。

无法在Cloudera Quickstart VM（5.10）中安装spark 2.2

我在这里关注了博客（下面提到的）并下载了包裹并按要求放置。如果安装了任何人和步骤，请告诉我。（HTTPS：//www.cloudera.com/documentation / ...

cloudera apache-spark-2.0 cloudera-quickstart-vm

回答 4 投票 3

我正在尝试使用livy，这是我第一次使用REST api。在本教程之后，当我输入r = requests.post（statements_url，data = json.dumps（data），headers = headers）然后输入r.json（）...

python rest cloudera hue

回答 3 投票 0

Cloudera Impala INVALIDATE METADATA

正如在impala教程中讨论的那样，Impala使用Hive共享的Metastore。但是有人提到如果你使用hive在表上创建或做一些版本，你应该执行INVALIDATE ......

hadoop hive cloudera impala

回答 3 投票 5

使用Java在单个语句中运行多个Hive查询时出错

我正在运行此查询：设置hive.limit.query.max.table.partition = 9000;选择不同的ps169作为hotel_code，pd5作为city_code，datediff（to_date（pd32），to_date（FROM_UNIXTIME（UNIX_TIMESTAMP（））））作为ap1 ...

java hadoop hive cloudera

回答 2 投票 2

有没有办法将节点添加到正在运行的Hadoop集群？

我一直在玩Cloudera，我在开始工作之前定义了簇的数量，然后使用cloudera管理器确保一切都在运行。我正在开发一个新项目......

hadoop cluster-computing hbase hdfs cloudera

回答 5 投票 14

hadoop，python，subprocess失败，代码为127

我正在尝试使用mapreduce运行非常简单的任务。 mapper.py:#！/ usr / bin / env python导入sys.stdin中的行sys：print line my txt file：qwerty asdfgh zxc运行作业的命令行：...

python hadoop mapreduce cloudera hadoop-streaming

回答 3 投票 3

列名称中的空格抛出异常，而镶木地板用于压缩

将数据插入到具有空格的列名称的镶木地板格式表中时，我遇到错误。使用Cloudera版本的Hive客户端CREATE TABLE testColumNames（First Name string）...

apache-spark hive cloudera parquet

回答 2 投票 1

HDFS作为cloudera quickstart docker中的音量

我对hadoop和docker都很新。我一直在努力扩展cloudera / quickstart docker image docker文件，并希望挂载目录表单主机并将其映射到hdfs位置，...

hadoop docker hdfs cloudera bigdata

回答 2 投票 4

连接到Hive从远程计算机上的R启用了Kerberos

我在我的本地机器上运行了一个R，我的蜂巢服务器在使用cloudera的aws机器上配置并启用了kerberos。我现在无法使用...从本地R实例连接到hive服务器

r jdbc hive kerberos cloudera

回答 1 投票 1

时间戳减少了插入覆盖中的小时

我一直在使用Sqoop，hive和Impala。我的Sqoop作业从SQL Server获取一个字段为datetime的字段，以写入存储为textfile的TABLE1。 TABLE1中的字段具有时间戳格式....

sql hive cloudera impala

回答 1 投票 0

Oozie + Sqoop：JDBC驱动程序Jar位置

我有一个基于6节点cloudera的hadoop集群，我正在尝试从oozie中的sqoop操作连接到oracle数据库。我已将我的ojdbc6.jar复制到sqoop lib位置（对我来说......

hadoop dependencies cloudera sqoop oozie

回答 4 投票 5

用于处理小消息文件的技术堆栈

我们正在一个项目中解码实时消息文件，这些文件以文本文件的形式传输给我们。该文件是非结构化文本，但我们有一个规范来解码它。有 ...

apache-spark hdfs bigdata cloudera real-time-data

回答 1 投票 -1

HBase：如何更改表的memstore？

我们要求在第0天我们将运行历史火花作业以将批量数据加载到HBase中。每天发布，我们只会将结束日数据添加到HBase。要处理这个......

hbase cloudera cloudera-cdh

回答 1 投票 0

差异b / w Mapr和Cloudera？

Cloudera是免费版和企业版，但MapR几乎是企业版的原因么？它们之间有什么重大区别吗？

cloudera mapr

回答 2 投票 0

Hive - 巨大的10TB表重新分区（添加新的分区列）

技术人员，背景 - 我们有10TB现有的蜂巢表，它在A列上进行了范围分区。业务案例有变化，现在除了A列之外还需要添加分区列B.

hive hdfs hbase cloudera impala

回答 1 投票 0

Cloudera CDH 5.13 - 是否可以在Yarn模式下运行spark 2.x？

团队，在我的本地计算机上安装了CDH 5.13版本，并从spark 1.6升级到spark 2.0。是否可以使用纱线模式运行火花应用。请确认。或者它将起作用......

apache-spark cloudera cloudera-manager

回答 1 投票 -1

在scala中使用split（）方法中的单引号和双引号有什么区别？

我正在研究cca-175练习题。给我一个文本文件，由|分开：Christopher | 2015年1月11日，| 5 Kapil | 2015年1月11日| 5 Thomas | 2014年6月17日| 5 John | 22-08-2013 | 5 Mithun | 2013 | 5 ...

scala apache-spark hadoop cloudera

回答 2 投票 0

直线无法连接到hiveserver2

我有一个CDH 5.3实例。我首先启动hive-metastore，然后从命令行启动hive-server，启动hive-server2。在此之后我使用beeline连接到我的hive-server2但是...

hadoop hive cloudera cloudera-manager

回答 7 投票 9

kafka集群中的Kafka管理器配置问题

我试图在我的kafka集群中安装和配置kafka管理器，但在构建kafka manager二进制文件时面临问题，如下所示。 ./sbt clean dist。服务器没有连接互联网，所以不...

apache-kafka cloudera confluent yahoo-kafka-manager

回答 1 投票 0

计算每行的单词数

我正在尝试使用sparklyr将R代码移动到spark中，我遇到了一些函数的麻烦，以便执行以下操作：-Count连续的单词总数：例如......

r apache-spark apache-spark-sql cloudera sparklyr

回答 1 投票 0

cloudera 相关问题

最新问题