cloudera 相关问题

Cloudera Inc.是一家位于Palo Alto的企业软件公司,提供基于Apache Hadoop的软件和服务。

如何使用python将配置单元表导出到不同本地的oracle表?

我有hadoop服务器,oracle和本地PC。这些在不同的ips上。我想在oracle和hive表之间导出和导入数据。我使用“ --target-dir”定义导入时使用的hdfs ...

回答 1 投票 0

Docker Cloudera存储库上的Ambari现在需要用户名和密码

我有一个脚本,该脚本会自动使用docker创建Ambari集群。在文件中:https://github.com/ortizfabio/caochong/blob/master/from-ambari/Dockerfile有一行可以下载...

回答 1 投票 1

如何为Windows 10的虚拟机下载quickstart VM 5.x?

如何下载适用于Windows 10的Virtual Box的quickstart VM 5.x?我已经安装了oracle虚拟盒。但是对于cloudera qickstart VM,我没有任何来源。我在google中搜索了很多,然后...

回答 1 投票 0

HBase拆分命令会抛出不可拆分错误

我试图强行分割一个区域,并收到以下错误。错误:org.apache.hadoop.hbase.DoNotRetryIOException:3dd9ec2b32c98131b39fbfa8266881f9无法拆分...

回答 1 投票 0

Cloudera CDH4:无法将主机添加到群集中,因为规范名称与主机名不一致

我正在使用Ubuntu 12.04 LTS在4节点群集上安装CDH4。我能够安装cloudera Manager并在主计算机上启动一个单节点集群。但是,一旦添加了新主机,CM就会说出来...

回答 2 投票 2

Windows 10 Hyper-v上的HDP 2.6.5

我正在尝试使用Hyper V Manager在Windows 10便携式计算机上运行HDP 2.6.5。我下载了VirtualBox版本并提取了.vmdk,然后使用VirtualBox软件将其转换为.vhd文件。 &'C:...

回答 1 投票 0

如何在hadoop hdfs中解压缩文件

我在本地目录中有很多JSON文件(1 MM)。我需要将这些JSON文件直接移至HDFS。创建了一个包含所有JSON文件的tar。 tar -cvf filename.tar ...

回答 1 投票 0

如何在cloudera中启动hadoop? [关闭]

我正在学习hadoop。我正在尝试使用cloudera。但是当我键入jps时,它不显示任何正在运行的进程。我需要启动hadoop吗?它不是自动启动hadoop吗?如果我们需要开始...

回答 1 投票 -6

仅不为字符串列保留在PySpark collect_set中的订单

我正在DataFrame上使用collect_set方法并添加3列。我的df如下:id acc_no acc_name cust_id 1 111 ABC 88 1 222 XYZ 99下面是...

回答 1 投票 0

如何理解Apache Impala的zlib压缩查询配置文件

目前,Impala将查询配置文件日志保存在/ var / log / impala / profiles中,每行的格式为 如其文档中提到的...

回答 1 投票 1

如何显示不使用kerberos或LDAP的NiFi登录名

[所有人,我正在尝试在Apache NiFi中通过用户名/密码设置用户身份验证,但不使用Kerberos或LDAP。她使用nifi工具包生成ssl证书,我已经通过...

回答 1 投票 0

Impala:获取匹配分区的列表

我们有一个impala表,按年= yyyy / month = mm / day = dd / hour = hh进行分区。客户端应用程序之一可以使用dd / mm / yyyy格式的from和a date向其发送选择查询。现在,...

回答 1 投票 0

Active Directory Ldap sync

如果我运行-ambari-server sync-ldap --groups groups.txt,它将仅导入ambari中的组还是AD中该组中的用户?当我运行时-从cli中获得组名group name我是...

回答 1 投票 0

CDP 7.0.3中的地图集:找不到指定的配置集:vertex_index

我在CDP群集中添加了Atlas,发现无法连接Web UI。在application.log中,我发现了错误:找不到指定的配置集:vertex_index。我遵循了...

回答 1 投票 -1

NameNode的高可用性(HA)与HDFS之间是否有区别?

我对HDFS的高可用性和名称节点感到困惑,这两件事是相同的还是不同的?

回答 3 投票 0

与Cloudera Impala的pyodbc连接在colab上失败

我已经安装了pyodbc并配置了系统ODBC。还有什么我应该配置的吗? pyodbc.autocommit = True conn = pyodbc.connect(“ DSN = Cloudera Impala DSN”,autocommit = True)print(“ pass”)游标= ...

回答 1 投票 -2

无法将Spark Dataframe写入cassandra表中

[我正在用Cassandra连接HDP3.0上的spark,以将数据帧写入cassandra表,但收到以下错误:在此处输入图像描述,在此处输入图像描述,我的代码将写入...]]

回答 2 投票 -1

在Ansible中使用CDH(Hadoop)

我是Ansible和CDH的新手,想学习使用Hadoop和Ansible。我已经在本地计算机上安装了CDH,并希望从ansible yml文件访问它。我只是想先运行...

回答 1 投票 0

Kafka控制台使用者在HDP 3中阅读Avro消息

[尝试使用来自控制台使用者的kafka Avro消息,而不完全确定如何反序列化消息。 sh /usr/hdp/current/kafka-broker/bin/kafka-console-consumer.sh --bootstrap-server ...

回答 1 投票 0

Hbase表中的不一致[区域未部署在任何区域服务器上]

在小型HBase群集中,所有从属节点都重新启动。当我启动HBase服务时,其中一个表(测试)变得不一致。在HDFS中,缺少某些块(hbase块)。原来是在...

回答 2 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.