cloudera 相关问题

Cloudera Inc.是一家位于Palo Alto的企业软件公司,提供基于Apache Hadoop的软件和服务。

Cloudera到HDP SOLR(版本5.5.2)数据迁移|在solr云上还原后无法更新solr索引

SOLR版本-5.5.2我的项目要求是将solr云索引从cloudera集群传输到HDP集群。数据量巨大(生产中有10亿条索引记录,因此重新索引不是...

回答 1 投票 1

来自Confluent或Cloudera的Kafka?

我的问题很简单,但很复杂,在我目前的公司中,我们正在评估将卡夫卡与汇合使用或将卡夫卡与cloudera一起使用。我发现了您所在的融合版本的主题...

回答 1 投票 0

在Cloudera Impala(虚拟机)中创建数据库时出错

我已经下载并使用impala启动了cloudera虚拟机。在执行数据库创建语句时,出现了与目录和状态存储服务有关的错误。 ...

回答 1 投票 0

Cloudera Manager使用主机名而不是IP

我通过URI访问Cloudera Manager的位置:http:// cmhostname:7180 /重定向到IP地址http://xxx.xxx.xxx.xxx:7180/如何更改,以便CM使用主机名而不是DNS? DNS和解析器有效...

回答 1 投票 0

PySpark无法从hdfs读取csv:HiveExternalCatalog错误

我是火花新手,在尝试调试错误时遇到了麻烦。我正在尝试从hdfs读取多个文件。我为此使用sparksession.read.csv,但出现错误:py4j.protocol.Py4JJavaError:An ...

回答 2 投票 0

运行多个SQL查询并测试是否通过Spark Scala失败

我正在运行100个查询(测试用例)以检查Spark Scala中的数据质量。我正在从配置单元表查询数据。对于这些示例查询,预期结果为空数据框:SELECT ...

回答 1 投票 0

集群模式下的异常,但在eclipse下运行可以正常工作

我不知道为什么我的Hadoop项目无法在命令行下执行 异常消息显示对我没有有用的信息 任何方向或想法 谢谢 在日食下完美运作 通过命令行运行的部分异常日志 完...

回答 2 投票 1

hadoop将int数组从map传递到reducer并作为输出

我正在学习使用hadoop并遇到以下问题:我需要将一个int数组从map函数传递给reducer,然后作为输出传递。所以看起来像这样:public ...

回答 1 投票 3

SSIS上的Hadoop Hive任务返回错误代码64

[我正在尝试在SSIS 2015中使用Hadoop Hive Task运行Hive查询。我尝试运行的查询是:如果不存在table_a,则创建table_a作为select * from(select code,md,name,...

回答 2 投票 1

如何在HDP 3.1中以外部形式在蜂巢中火花写入(创建)表

默认的spark-shell --conf spark.hadoop.metastore.catalog.default = hive val df:Dataframe = ... df.write.saveAsTable(“ db.table”)尝试写入内部/时失败托管/交易...

回答 1 投票 0

配置单元:如何将数据从分区表插入分区表中?

[这是我之前提出的问题的扩展:是否可以在由AVRO模式文件定义的EXTERNAL表上更改现有列的元数据?问题:在Hive 2.1.1中,如何...

回答 1 投票 0

是否可以在由AVRO模式文件定义的EXTERNAL表上更改现有列的元数据?

这是我问过的上一个问题的扩展:是否可以更改Hive分区表上的列的元数据?问题:是否可以更改现有列的...

回答 1 投票 1

将多个文件从本地Unix移至HDFS

我必须将一个文件移到Unix目录中的几个文件中。我知道copyFromLocal命令:用法:hadoop fs -copyFromLocal URI,但这使我可以一一移动。有没有...

回答 1 投票 0

是否可以在HIVE中更改分区元数据?

这是我之前问的问题的扩展:如何比较具有不同数据类型组的两列我们正在探索改变表上元数据的想法,而不是...

回答 1 投票 1

Apache nifi将年,月和日时间戳附加到合并的输出文件中

我正在创建端到端流,以通过对通过Tealium事件流接收的Json文件使用Consume Kafka来将数据消耗到HDFS中。目前,我已经使用Consum Kafka->评估Json路径-> ...

回答 2 投票 0

如何比较具有不同数据类型组的两列

这是我昨天提出的问题的扩展:在不同组中的数据类型之间进行比较时,如何处理潜在的数据丢失在HIVE中,是否可以执行...

回答 1 投票 0

在不同组中的数据类型之间进行比较时,如何处理潜在的数据丢失

背景:我们的小组正在将Cloudera升级到6.1.1,我的任务是确定如何处理跨数据类型的隐式数据类型转换的丢失。请参阅下面的链接...

回答 1 投票 0

为RODBC安装Cloudera Impala ODBC驱动程序

我已经尝试非常仔细地遵循安装指南,以在Mac上为R设置Impala Cloudera ODBC驱动程序,但始终收到以下错误消息:在odbcDriverConnect(“ DSN = ...

回答 2 投票 2

Hue Filebrowser Search仅在第一层搜索

我已经在AWS上的Cloudera Manager中安装了Hue。我上载了一些目录,里面只有几个文件。如果我在/ user / hdfs路径上,则存在诸如project1,project2之类的目录。如果我是...

回答 2 投票 0

如何sparkcontext连接到CDH 6纱

我试图从CDH 6个社区版本的远程计算机上运行, 从一个简单的Java mllib功能(fpgrowth)。作为默认我试图连接是这样的:`SparkConf CONF =新SparkConf()....

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.