hadoop2 相关问题

Hadoop 2代表了非常流行的开源分布式平台Apache Hadoop的第二代。

我正在尝试使用python连接到hive [with default derby db]：from impala.dbapi import connect conn = connect（host ='localhost'，port = 10000）cursor = conn.cursor（）cursor.execute（'SELECT *来自......

python python-2.7 hadoop hive hadoop2

回答 1 投票 0

在hadoop 2.4.1中启动namenode时出错

当我尝试使用以下命令启动dfs时：start-dfs.sh我收到一条错误消息：14/07/03 11:03:21 WARN util.NativeCodeLoader：无法为您的平台加载native-hadoop库...使用builtin- java ...

hadoop hadoop2 jvm-arguments

回答 4 投票 0

无法启动AWS EC2实例上HDP2.6.1 Sandbox的大多数服务

我在AWS EC2 [c5.4xlarge - CentOS 7（x86_64） - with Updates]实例上使用docker安装了HDP2.6.1沙箱。我也可以更改管理员密码，并能够登录到Ambari UI ...

hadoop amazon-ec2 hadoop2 hortonworks-sandbox hdp

回答 1 投票 0

spark-submit集群模式不适用于python spark，但适用于scala spark

我有一个集群，我们有hadoop设置与spark集成。 spark版本是spark v2.0.0，当你在集群模式下部署scala spark时，它按预期工作。以下是命令：...

pyspark yarn hadoop2 apache-spark-2.0 spark-submit

回答 1 投票 0

如何解决YARN日志中的日志聚合未完成或未启用错误

我正在使用EMR 5.4并且我向纱线提交火花作业当我尝试使用纱线日志-applicationId application_1528461193301_0001来检索日志时，我有以下错误：18/06/08 12:38:01 INFO ...

hadoop hdfs yarn hadoop2 amazon-emr

回答 1 投票 2

用于列出HADOOP 2.x中映射器和缩减器数量的命令

是否有任何hadoop / yarn命令可以动态列出作业使用的映射器/减速器/插槽的数量

java yarn hadoop2

回答 1 投票 0

Hadoop Container甚至100％完成失败

我已经设置了一个小集群Hadoop 2.7，Hbase 0.98和Nutch 2.3.1。我编写了一个自定义作业，简单地首先组合相同域的文档，之后域的每个URL（来自缓存，即列表）是......

hadoop mapreduce timeout hadoop2 nutch

回答 1 投票 0

如何删除配置单元中的多个数据库？

是否可以删除Hive中的多个数据库？如何查看表中给出的注释，描述没有显示出来？还有原始数据类型如何使用where子句？

hadoop hive hiveql hadoop2

回答 1 投票 -1

无法从namenode（master）启动集群：datanode（slave）和namenode（master）上的不同$ HADOOP_HOME

我在主服务器和从服务器上使用Hadoop 1.2.1，但我将它们安装在不同的目录上。所以当我在master上调用bin / start-dfs.sh时，我收到以下错误。 partho @ partho-Satellite-L650：......

hadoop hadoop2

回答 4 投票 0

Hadoop Windows设置。运行WordCountJob时出错：“任何本地目录中都没有可用空间”

我正在关注这个视频教程，尝试在我的机器上设置hadoop。如何在Windows 10上安装Hadoop我已成功设置它：从sbin目录执行start-all.xml时没有错误。 ...

windows hadoop hadoop2

回答 2 投票 4

纱线：使yarn-site.xml更改在群集中的工作节点上有效

我们有一个在HDFS 2.7.3上运行的火花流应用程序，Yarn作为资源管理器。在运行应用程序时，这两个文件夹：/ tmp / hadoop / data / nm-local-dir / filecache / tmp / ...

hadoop yarn hadoop2

回答 1 投票 5

带有纪元时间戳的Sqoop增量加载

使用Sqoop增量工具需要在--last-value中提供最后修改日期，格式类似于2016-09-05 06：04：27.0。在这种情况下，源MySQL数据库中的问题，update_date ...

sqoop hadoop2 epoch

回答 1 投票 0

gridmix输入格式是什么样的？

我使用Rumen mine作业历史文件，包含job-trace.json和job-topology.json。 GirdMix用法喜欢：$ HADOOP_HOME / bin / hadoop jar $ HADOOP_HOME / share / hadoop / tools / lib / hadoop-gridmix-2.7.3.jar -...

mapreduce benchmarking hadoop2

回答 1 投票 1

我想找到与数据帧比较100列的最大值

我有一个数据帧syr | P1 | P2 ----------------- 1 | 200 | 300 2 | 500 | 700 3 | 900 | 400我想创建另一个DataFrame，它具有col2和col3之间的最大值。一个......

apache-spark-sql hadoop2

回答 1 投票 -2

如何在Hadoop中对自定义可写类型进行排序

我有一个自定义类型，其中包含Hadoop本机类型的字段（例如Text和IntWritable），需要在随机/排序阶段使用它作为键和排序。有类似的问题......

java sorting hadoop mapreduce hadoop2

回答 1 投票 0

我们是否可以为现有群集中的非root用户配置ambari

我知道在设置新集群时为非root用户配置ambari，但是是否可以在由root运行的现有集群中执行此操作。赞赏你的帮助。

hadoop2 hortonworks-data-platform ambari

回答 1 投票 0

如何在没有HDFS的情况下部署HDP群集？

如何在没有HDFS的情况下部署HDP群集，因为我不希望HDFS用于存储，并且将使用内部内存存储系统。如何才能做到这一点？

hadoop2 ambari hdp

回答 2 投票 0

在大文件的EMR上运行时，Hive Vertex失败，vertexName = Map 2

我在EMR集群上运行我的hive查询，该集群是25个节点的集群，我在stances中使用了r4.4xlarge来运行它。当我运行我的查询时，我得到以下错误。作业提交失败，异常'......

hive yarn hiveql hadoop2 amazon-emr

回答 2 投票 0

在Ambari上设置群集时，确认单个节点群集的主机失败

我试图在单节点集群上设置Ambari。 Ambari设置以root用户身份完成我尝试了与此相关的所有帖子，更改权限并设置为权限http：//docs.hortonworks ....

hadoop hadoop2 ambari bigdata

回答 2 投票 0

为什么当环境改变Dev to Prod时，这个Unzip shell脚本的行为会有所不同？

output_path = s3：//输出unziped_dir = s3：// 2019-01-03 files =`hadoop fs -ls $ output_path / | awk'{print $ NF}'| grep .gz $ | tr'\ n'''`;对于$ file中的f，回显“可用文件是：$ f”filename = $（...

shell apache-spark unix hadoop2

回答 1 投票 1

hadoop2 相关问题

最新问题