hadoop 相关问题

Hadoop是一个Apache开源项目,为可靠和可扩展的分布式计算提供软件。核心由分布式文件系统(HDFS)和资源管理器(YARN)组成。各种其他开源项目,例如Apache Hive,使用Apache Hadoop作为持久层。

错误:无法设置资源管理器进程 89885 的优先级和错误:无法设置节点管理器进程 89986 的优先级

我想在Mac上通过Homebrew下载Hadoop。我完成直到将名称节点格式化为 hdfs 名称节点格式。我也删除了密码要求,但是当我在...下启动集群时

回答 1 投票 0

如何在 RedHat 上安装 Apache Impala?

我正在尝试按照官方链接在 Redhat 上安装 Apache Impala,但这没有用。 谁能给我提供正确的文件来安装 Impala 的开源版本或指南...

回答 0 投票 0

Hadoop on centos7 singleton, resouremanager 启动失败

我是 Hadoop 新手。这几天在虚拟机Esxi上安装了Hadoop on Centos7。除资源管理器外,所有服务均已启动。我可以在端口 9870 访问名称节点。但是...

回答 0 投票 0

为什么使用 Hadoop PIG 后使用 ORDER 后使用 LIMIT 失败

如果我对关系进行排序然后使用 LIMIT 它会失败并出现错误: 错误 1066:无法打开别名最旧的迭代器 这是输入数据,dataset.csv 约翰,27岁 玛丽,31 大卫,45岁 艾米丽,22

回答 0 投票 0

Hadoop 命令说 JAVA_HOME 设置不正确

我在给出 Hadoop 命令时遇到以下错误(请参考图片) 有人告诉我如何解决它。 笔记: Java Home 本地位置:“C:\Program Files\Java\jdk-20” Hadoop 主页...

回答 1 投票 0

更改 hdfs 中的节点

我们有将配置文件上传到 HDFS 的代码: 从 hdfs 导入 InsecureClient def upload_file_to_hdfs(local_path,remote_path): client = InsecureClient(url='http://hdfs_server:50070', user='...

回答 0 投票 0

Gradle 存档包含超过 65535 个条目

我正在集成 hadoop2.5.0 以运行 mapreduce 作业和 spring-boot-1.2.7 版本并在包含此时出现错误 1) 存档包含超过 65535 个条目。 我的 gradle jar 依赖 j...

回答 1 投票 0

AWS EMR 中的 Spark Scala 作业随机失败并出现错误 org.xml.sax.SAXParseException;文件过早结束

我有一个在 AWS EMR(emr-5.31.0) 中运行的 Spark(2.4.6) Scala 作业随机失败并出现错误 org.xml.sax.SAXParseException;文件过早结束。这项工作一直覆盖镶木地板文件......

回答 0 投票 0

sbt 运行在 Spark 中显示“java.nio.file.NoSuchFileException: xxx/hadoop-client-api-3.3.4.jar”

当我在 Scala 2.12 中为 Spark 应用程序运行 sbt run 时,该应用程序成功。 但是,最后我仍然遇到错误,这不会影响应用程序本身: sbt 运行 [信息] 欢迎使用 sbt 1.8.2 (Homebrew ...

回答 1 投票 0

无法在 linux 上使用 mapreduce 处理文本文件

我目前正在尝试使用 Hadoop 流。我有一个名为 diamonds.txt 的文件,其中包含钻石的克拉数及其旁边的价格,全部以逗号分隔 (csv)。 第一个例子......

回答 0 投票 0

在什么情况下,禁用 Hadoop 向量化执行比启用它更好

Hive 中的矢量化是一项功能(可从 Hive 0.13.0 获得),当启用时而不是一次读取一行读取 1024 行上的块。这提高了 CPU 使用率等操作,...

回答 0 投票 0

无法启动蜂巢

我无法在遵循入门程序时启动 Hive 这是错误: $./蜂巢 SLF4J:类路径包含多个 SLF4J 绑定。 SLF4J:在 [jar:file:/home/

回答 2 投票 0

如何使用 sqoop 将 postgresql 数据库增量备份到 hadoop

我有一个名为 test 的数据库,我在其中创建了一个名为 sqoop2 的表。其中包含 15 行与 updated_date 分隔的行。所以当我在查询下面运行但没有查询帮助我们做

回答 0 投票 0

spark rdd 中创建的分区数

我在 Hadoop 文件系统中有一个名为 hello.txt 的文件,有 32 个字节。 它在 HDFS 中创建了 1 个数据块。据我所知,理想情况下,它应该创建 1 个等于文件数据块数的分区。 但是在

回答 2 投票 0

如何为 hadoop 3.3.5 构建 hadoop 公共库

我正在尝试从主要指南构建 hadoop native 这是我通过 docker ubuntu 尝试过的:最新图像 apt-get更新&& apt-get升级-y apt-get install wget git gnupg softw...

回答 0 投票 0

无法找到“resource-types.xml”。这显示了当我尝试在 win 10 上的 hadoop 上运行 wordcount 作业时

工作会开始,但只是卡住了,什么也做不了。文件和作业信息如下: 1、cmd上的job信息 PS C:\hadoop-env\hadoop-3.2.1> hadoop jar C:\hadoop-env\hadoop-3.2.1...

回答 0 投票 0

Oozie 发行版创建失败/在 Hadoop (AWS EC2) 上安装 Oozie

我正在努力更好地了解这里发生的事情。我对这一切真的很陌生。 Oozie-5.2.1 Hadoop-3.3.5 Java openjdk 版本“11.0.18” [信息] --------------< org.apache.

回答 0 投票 0

如何在 Java map reduce 中为输出文件添加标头?

我想根据传递给 reducer 的密钥向 hadoop map reduce 的输出文件添加一个标头,也就是说,我希望标头根据 reducer 正在处理的输入而变化。有没有办法...

回答 0 投票 0

OpenJDK 客户端虚拟机 - 无法分配内存

我在集群上运行 Hadoop map reduce 作业。 我收到此错误。 OpenJDK 客户端 VM 警告:信息:os::commit_memory(0x79f20000, 104861696, 0) 失败; error='无法分配内存'(errno ...

回答 4 投票 0

寻找一种使用 HDFS 和 MapReduce 或 Spark 存储和处理原始 NetCDF 文件(科学数据)的方法?

我实际上正在从事一个空间大数据项目(NetCDF 文件),我想将这些数据(netcdf 文件)存储在 hdfs 上并使用 mapreduce 或 spark 对其进行处理,以便用户将查询发送为 AVG,m.. .

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.