cloudera 相关问题

Cloudera Inc.是一家位于Palo Alto的企业软件公司,提供基于Apache Hadoop的软件和服务。

如何在hadoop hdfs中解压缩文件

我在本地目录中有很多JSON文件(1 MM)。我需要将这些JSON文件直接移至HDFS。创建了一个包含所有JSON文件的tar。 tar -cvf filename.tar ...

回答 1 投票 0

如何在cloudera中启动hadoop? [关闭]

我正在学习hadoop。我正在尝试使用cloudera。但是当我键入jps时,它不显示任何正在运行的进程。我需要启动hadoop吗?它不是自动启动hadoop吗?如果我们需要开始...

回答 1 投票 -6

仅不为字符串列保留在PySpark collect_set中的订单

我正在DataFrame上使用collect_set方法并添加3列。我的df如下:id acc_no acc_name cust_id 1 111 ABC 88 1 222 XYZ 99下面是...

回答 1 投票 0

如何理解Apache Impala的zlib压缩查询配置文件

目前,Impala将查询配置文件日志保存在/ var / log / impala / profiles中,每行的格式为 如其文档中提到的...

回答 1 投票 1

如何显示不使用kerberos或LDAP的NiFi登录名

[所有人,我正在尝试在Apache NiFi中通过用户名/密码设置用户身份验证,但不使用Kerberos或LDAP。她使用nifi工具包生成ssl证书,我已经通过...

回答 1 投票 0

Impala:获取匹配分区的列表

我们有一个impala表,按年= yyyy / month = mm / day = dd / hour = hh进行分区。客户端应用程序之一可以使用dd / mm / yyyy格式的from和a date向其发送选择查询。现在,...

回答 1 投票 0

Active Directory Ldap sync

如果我运行-ambari-server sync-ldap --groups groups.txt,它将仅导入ambari中的组还是AD中该组中的用户?当我运行时-从cli中获得组名group name我是...

回答 1 投票 0

CDP 7.0.3中的地图集:找不到指定的配置集:vertex_index

我在CDP群集中添加了Atlas,发现无法连接Web UI。在application.log中,我发现了错误:找不到指定的配置集:vertex_index。我遵循了...

回答 1 投票 -1

NameNode的高可用性(HA)与HDFS之间是否有区别?

我对HDFS的高可用性和名称节点感到困惑,这两件事是相同的还是不同的?

回答 3 投票 0

与Cloudera Impala的pyodbc连接在colab上失败

我已经安装了pyodbc并配置了系统ODBC。还有什么我应该配置的吗? pyodbc.autocommit = True conn = pyodbc.connect(“ DSN = Cloudera Impala DSN”,autocommit = True)print(“ pass”)游标= ...

回答 1 投票 -2

无法将Spark Dataframe写入cassandra表中

[我正在用Cassandra连接HDP3.0上的spark,以将数据帧写入cassandra表,但收到以下错误:在此处输入图像描述,在此处输入图像描述,我的代码将写入...]]

回答 2 投票 -1

在Ansible中使用CDH(Hadoop)

我是Ansible和CDH的新手,想学习使用Hadoop和Ansible。我已经在本地计算机上安装了CDH,并希望从ansible yml文件访问它。我只是想先运行...

回答 1 投票 0

Kafka控制台使用者在HDP 3中阅读Avro消息

[尝试使用来自控制台使用者的kafka Avro消息,而不完全确定如何反序列化消息。 sh /usr/hdp/current/kafka-broker/bin/kafka-console-consumer.sh --bootstrap-server ...

回答 1 投票 0

Hbase表中的不一致[区域未部署在任何区域服务器上]

在小型HBase群集中,所有从属节点都重新启动。当我启动HBase服务时,其中一个表(测试)变得不一致。在HDFS中,缺少某些块(hbase块)。原来是在...

回答 2 投票 2

Impala:根据日期和时间将单行拆分为多行

我想根据时间将单行分成多行。 SrNo Employee StartDate EndDate ---------------------------------------------- ----------------------------- 1 ...

回答 1 投票 0

根据Impala中的日期和时间将单行拆分为多行

我想根据时间将单行分成多行。 SrNo Employee StartDate EndDate ---------------------------------------------- ----------------------------- 1 ...

回答 1 投票 0

NameNode HA与HDFS之间的区别?

我对hdfs的高可用性和名称节点感到困惑,这两件事是相同的还是不同的?

回答 2 投票 1

Ambari管理员登录名使用正确的凭据挂起,使用无效的凭据引发正确的错误

我已经在Centos 7服务器上以Mysql 5.7.29作为后端安装了Ambari 2.7.0。所有服务运行正常,但是当我尝试使用admin:admin凭据登录时,它似乎挂起并显示以下日志...

回答 1 投票 0

Hue Solr搜索运行缓慢

虽然在Solr中以色相显示数据(8000+列30000+行),但色相运行非常缓慢。它只有3个用户,并且消耗大约7 Gig的内存。通过Docker安装。大概是...

回答 1 投票 0

[尝试从Spark查询HBase上的数据时出现NoSuchMethodError

我正在尝试使用SparkSQL / DataFrames查询加载到HBase表中的数据。我的集群基于Cloudera CDH 6.2.0(Spark版本2.4.0和HBase版本2.1.0)。遵循本指南,我...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.