Cloudera Inc.是一家位于Palo Alto的企业软件公司,提供基于Apache Hadoop的软件和服务。
如何使用python将配置单元表导出到不同本地的oracle表?
我有hadoop服务器,oracle和本地PC。这些在不同的ips上。我想在oracle和hive表之间导出和导入数据。我使用“ --target-dir”定义导入时使用的hdfs ...
Docker Cloudera存储库上的Ambari现在需要用户名和密码
我有一个脚本,该脚本会自动使用docker创建Ambari集群。在文件中:https://github.com/ortizfabio/caochong/blob/master/from-ambari/Dockerfile有一行可以下载...
如何为Windows 10的虚拟机下载quickstart VM 5.x?
如何下载适用于Windows 10的Virtual Box的quickstart VM 5.x?我已经安装了oracle虚拟盒。但是对于cloudera qickstart VM,我没有任何来源。我在google中搜索了很多,然后...
我试图强行分割一个区域,并收到以下错误。错误:org.apache.hadoop.hbase.DoNotRetryIOException:3dd9ec2b32c98131b39fbfa8266881f9无法拆分...
Cloudera CDH4:无法将主机添加到群集中,因为规范名称与主机名不一致
我正在使用Ubuntu 12.04 LTS在4节点群集上安装CDH4。我能够安装cloudera Manager并在主计算机上启动一个单节点集群。但是,一旦添加了新主机,CM就会说出来...
我正在尝试使用Hyper V Manager在Windows 10便携式计算机上运行HDP 2.6.5。我下载了VirtualBox版本并提取了.vmdk,然后使用VirtualBox软件将其转换为.vhd文件。 &'C:...
我在本地目录中有很多JSON文件(1 MM)。我需要将这些JSON文件直接移至HDFS。创建了一个包含所有JSON文件的tar。 tar -cvf filename.tar ...
我正在学习hadoop。我正在尝试使用cloudera。但是当我键入jps时,它不显示任何正在运行的进程。我需要启动hadoop吗?它不是自动启动hadoop吗?如果我们需要开始...
仅不为字符串列保留在PySpark collect_set中的订单
我正在DataFrame上使用collect_set方法并添加3列。我的df如下:id acc_no acc_name cust_id 1 111 ABC 88 1 222 XYZ 99下面是...
如何理解Apache Impala的zlib压缩查询配置文件
目前,Impala将查询配置文件日志保存在/ var / log / impala / profiles中,每行的格式为 如其文档中提到的...
[所有人,我正在尝试在Apache NiFi中通过用户名/密码设置用户身份验证,但不使用Kerberos或LDAP。她使用nifi工具包生成ssl证书,我已经通过...
我们有一个impala表,按年= yyyy / month = mm / day = dd / hour = hh进行分区。客户端应用程序之一可以使用dd / mm / yyyy格式的from和a date向其发送选择查询。现在,...
如果我运行-ambari-server sync-ldap --groups groups.txt,它将仅导入ambari中的组还是AD中该组中的用户?当我运行时-从cli中获得组名group name我是...
CDP 7.0.3中的地图集:找不到指定的配置集:vertex_index
我在CDP群集中添加了Atlas,发现无法连接Web UI。在application.log中,我发现了错误:找不到指定的配置集:vertex_index。我遵循了...
与Cloudera Impala的pyodbc连接在colab上失败
我已经安装了pyodbc并配置了系统ODBC。还有什么我应该配置的吗? pyodbc.autocommit = True conn = pyodbc.connect(“ DSN = Cloudera Impala DSN”,autocommit = True)print(“ pass”)游标= ...
无法将Spark Dataframe写入cassandra表中
[我正在用Cassandra连接HDP3.0上的spark,以将数据帧写入cassandra表,但收到以下错误:在此处输入图像描述,在此处输入图像描述,我的代码将写入...]]
我是Ansible和CDH的新手,想学习使用Hadoop和Ansible。我已经在本地计算机上安装了CDH,并希望从ansible yml文件访问它。我只是想先运行...
[尝试使用来自控制台使用者的kafka Avro消息,而不完全确定如何反序列化消息。 sh /usr/hdp/current/kafka-broker/bin/kafka-console-consumer.sh --bootstrap-server ...
在小型HBase群集中,所有从属节点都重新启动。当我启动HBase服务时,其中一个表(测试)变得不一致。在HDFS中,缺少某些块(hbase块)。原来是在...