cloudera 相关问题

Cloudera Inc.是一家位于Palo Alto的企业软件公司,提供基于Apache Hadoop的软件和服务。

如何在MR作业中配置映射以批量执行?

Map-reduce作业生成几个映射器并在Yarn中运行。如何批量运行这些映射器。假设MR作业产生了100个地图,如何一次只运行10个以及如何配置下一个10个地图...

回答 1 投票 0

同时使用max和sum

我有一种情况,我必须总和和最大数量来处理每天多个条目。我在cloudera配置单元中有一个输入表:---------------------------- date1 | date2 ......

回答 1 投票 0

HDFS基准测试 - Terasort输出记录数

这个问题与terasort的例子有关。是否有任何参数可以使用terasort更改输出记录的数量?使用teragen生成的输入为65'536'000但我们要求运行...

回答 1 投票 0

Cloudera 5.6:Parquet不支持日期。见HIVE-6384

我目前正在使用Cloudera 5.6尝试基于另一个表在hive表中创建一个镶木地板格式表,但我遇到了一个错误。创建表sfdc_opportunities_sandbox_parquet像...

回答 1 投票 6

Cloudera Manager软件升级到最新版本

在升级cloudera manager和cdh服务之前,我们是否需要禁用Kerberos和TLS。我计划将cloudera manager 5.9升级到5.11.2,但cloudera hadooop集群启用了kerberos并且......

回答 2 投票 0

如何为Hadoop生态系统配置主机文件

![在此处输入图像描述] [1]这个问题可能看起来非常明显,但由于hadoop集群上主机文件的配置错误,我已经多次遇到过这个问题。任何人都可以描述如何设置......

回答 3 投票 4

cloudera impala中的多个查询执行

是否可以在impala中同时执行多个查询?如果是,那么黑斑羚如何处理呢?

回答 4 投票 2

使用python在JSON中查找重复项

我是python的新手,我正在尝试实现以下功能:向cloudera-Manager的IP发送一个get请求,它返回一个具有以下结构的主机JSON:{“items”:[{“hostId”:. ..

回答 2 投票 2

无法卸载在ubuntu计算机上通过CDH5安装的sqoop

我从Cloudera Manager卸载了sqoop,但我仍然看到通过终端的sqoop版本:chaithu @ localhost:〜$ sqoop version警告:/opt/cloudera/parcels/CDH-5.13.1-1.cdh5.13.1.p0.2/bin /../ LIB / ...

回答 1 投票 0

由于java.lang.NoSuchMethodException:org.apache.hadoop.hive.ql.metadata.Hive.loadDynamicPartitions,Spark作业失败

由于以下错误,我通过spark-submit运行spark作业有问题:16/11/16 11:41:12错误yarn.ApplicationMaster:用户类抛出异常:java.lang.NoSuchMethodException:org ... 。

回答 1 投票 0

蜂巢输出最后由这两个警告组成。如何抑制这2个警告

使用UDF的Hive查询输出最后包含这两个警告。如何抑制这2个警告。请注意,输出后输出的2个警告就是输出的一部分。警告:......

回答 2 投票 4

创建Cloudera地块时无法使用“替代”键

我尝试在parcels.json中使用“alternative”键。但是,Cloudera parcel验证器用以下方法将其踢出:==>无法识别的字段“scripts.alternatives”。认可的领域是“[定义,......

回答 1 投票 0

Sqoop不会将NULL值导入HBase

我有以下命令从Oracle导入到Hbase:sqoop-import -Dsqoop.hbase.add.row.key = true -Dhbase.zookeeper.quorum = zk.localdomain --verbose --connect jdbc:oracle:thin:@ 127.0.0.1:...

回答 1 投票 0

Hue服务器错误“checkJobBrowserStatus”cloudera hadoop

我在访问Hue webUI时遇到了一些问题。我只是对Hue上任何网页的每次访问都得到“500服务器错误”。错误示例:从日志文件中我得到了一些关于类型的信息......

回答 1 投票 0

CCA175的Sqoop / Hive:获取表AlreadyExistsException

我正在准备我的CCA175考试。我试图将mysql数据库retail_db导入到配置单元但是收到此错误。我尝试了几次,也从这些文件夹中删除了目录/文件; /用户/...

回答 2 投票 0

如何在cloudera中为Hue添加jar文件?

我正在JSON serde表上运行SQL查询。它在Hive CLI中工作,但它在色调失败时出现错误:处理语句时出错:FAILED:执行错误,从...返回代码2

回答 3 投票 1

问题在Yarn Cluster上运行Spark Job

我想在Hadoop YARN集群模式下运行我的spark Job,我使用以下命令:spark-submit --master yarn-cluster --driver-memory 1g --executor-memory 1g ...

回答 5 投票 16

无法将Sentry与Hive绑定

这篇文章是关于绑定Sentry与Hive。我一直面对这个问题。我的主要目标是提供对创建时具有权限的数据库和表的访问权限......

回答 1 投票 0

HBase例外

当我在伪群集模式下使用HBase时,我得到以下异常。如果有人可以解决这个问题来解决它org.apache.hadoop.hbase.client,那真的很棒。

回答 1 投票 0

在HBase之上的solr中创建索引

无论如何,我可以在Solr中创建索引,以便从近期实时HBase执行全文搜索。我不想将整个文本存储在我的solr索引中。制作“存储=假”......

回答 1 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.