Cloudera Inc.是一家位于Palo Alto的企业软件公司,提供基于Apache Hadoop的软件和服务。
无法在Cloudera Quickstart VM(5.10)中安装spark 2.2
我在这里关注了博客(下面提到的)并下载了包裹并按要求放置。如果安装了任何人和步骤,请告诉我。 (HTTPS://www.cloudera.com/documentation / ...
我正在尝试使用livy,这是我第一次使用REST api。在本教程之后,当我输入r = requests.post(statements_url,data = json.dumps(data),headers = headers)然后输入r.json()...
Cloudera Impala INVALIDATE METADATA
正如在impala教程中讨论的那样,Impala使用Hive共享的Metastore。但是有人提到如果你使用hive在表上创建或做一些版本,你应该执行INVALIDATE ......
我正在运行此查询:设置hive.limit.query.max.table.partition = 9000;选择不同的ps169作为hotel_code,pd5作为city_code,datediff(to_date(pd32),to_date(FROM_UNIXTIME(UNIX_TIMESTAMP())))作为ap1 ...
我一直在玩Cloudera,我在开始工作之前定义了簇的数量,然后使用cloudera管理器确保一切都在运行。我正在开发一个新项目......
hadoop,python,subprocess失败,代码为127
我正在尝试使用mapreduce运行非常简单的任务。 mapper.py:#!/ usr / bin / env python导入sys.stdin中的行sys:print line my txt file:qwerty asdfgh zxc运行作业的命令行:...
将数据插入到具有空格的列名称的镶木地板格式表中时,我遇到错误。使用Cloudera版本的Hive客户端CREATE TABLE testColumNames(First Name string)...
HDFS作为cloudera quickstart docker中的音量
我对hadoop和docker都很新。我一直在努力扩展cloudera / quickstart docker image docker文件,并希望挂载目录表单主机并将其映射到hdfs位置,...
我在我的本地机器上运行了一个R,我的蜂巢服务器在使用cloudera的aws机器上配置并启用了kerberos。我现在无法使用...从本地R实例连接到hive服务器
我一直在使用Sqoop,hive和Impala。我的Sqoop作业从SQL Server获取一个字段为datetime的字段,以写入存储为textfile的TABLE1。 TABLE1中的字段具有时间戳格式....
我有一个基于6节点cloudera的hadoop集群,我正在尝试从oozie中的sqoop操作连接到oracle数据库。我已将我的ojdbc6.jar复制到sqoop lib位置(对我来说......
我们正在一个项目中解码实时消息文件,这些文件以文本文件的形式传输给我们。该文件是非结构化文本,但我们有一个规范来解码它。有 ...
我们要求在第0天我们将运行历史火花作业以将批量数据加载到HBase中。每天发布,我们只会将结束日数据添加到HBase。要处理这个......
技术人员,背景 - 我们有10TB现有的蜂巢表,它在A列上进行了范围分区。业务案例有变化,现在除了A列之外还需要添加分区列B.
Cloudera CDH 5.13 - 是否可以在Yarn模式下运行spark 2.x?
团队,在我的本地计算机上安装了CDH 5.13版本,并从spark 1.6升级到spark 2.0。是否可以使用纱线模式运行火花应用。请确认 。或者它将起作用......
在scala中使用split()方法中的单引号和双引号有什么区别?
我正在研究cca-175练习题。给我一个文本文件,由|分开:Christopher | 2015年1月11日,| 5 Kapil | 2015年1月11日| 5 Thomas | 2014年6月17日| 5 John | 22-08-2013 | 5 Mithun | 2013 | 5 ...
我有一个CDH 5.3实例。我首先启动hive-metastore,然后从命令行启动hive-server,启动hive-server2。在此之后我使用beeline连接到我的hive-server2但是...
我试图在我的kafka集群中安装和配置kafka管理器,但在构建kafka manager二进制文件时面临问题,如下所示。 ./sbt clean dist。服务器没有连接互联网,所以不...
我正在尝试使用sparklyr将R代码移动到spark中,我遇到了一些函数的麻烦,以便执行以下操作:-Count连续的单词总数:例如......