hadoop 相关问题

Hadoop是一个Apache开源项目，为可靠和可扩展的分布式计算提供软件。核心由分布式文件系统（HDFS）和资源管理器（YARN）组成。各种其他开源项目，例如Apache Hive，使用Apache Hadoop作为持久层。

运行 MapReduce 作业显示错误 - Mkdirs 无法创建 /var/folders/

当我在 Mac 终端中运行 MapReduce 作业时： PawandeepSingh1$ hadoop jar MaximumTemperature.jar 线程“main”中出现异常 java.io.IOException：Mkdirs 无法创建 /var/folders/v1/

hadoop hdfs ioexception

回答 4 投票 0

错误：py4j.Py4JException：方法 sql([class java.lang.String, class [Ljava.lang.Object;]) 不存在

我正在使用 Pyspark 3.4.1、java 8、hadoop 3.4.0、scala 2.12.17、python 3.11.4，这是我在 vscode 中的代码： def计算点击（df）： click_data = df.filter((df.custom_track == "点击&qu...

java hadoop pyspark

回答 1 投票 0

IllegalArgumentException：java.net.UnknownHostException：NNode

我可以使用 DBeaver 连接位于不同虚拟机中的配置单元表。当我尝试通过 pyspark 连接我的配置单元时，我能够查看模式中的所有表，但是当我尝试查询时...

hadoop pyspark jupyter-notebook

回答 0 投票 0

在 Flink 应用程序中从 AWS S3 存储桶读取 ORC 文件

我们正在使用 Flink 版本 1.13.5 并尝试从 AWS S3 位置读取 ORC 文件。而且，我们正在将应用程序部署在自我管理的 Flink 集群中。请查找以下代码以了解更多信息...

hadoop apache-flink flink-streaming orc

回答 1 投票 0

我不断收到错误：value max is not a member of org.apache.spark.sql.DataFrame on Spark Scala

所以我尝试在 DataProc 上使用 Spark Scala 评估数据集。我需要找到最大值和其他等等，但每次我尝试使用简单的逗号找到最大值时，我总是收到错误...

scala apache-spark hadoop

回答 1 投票 0

如何将apache/hive镜像与apache/hadoop镜像连接？

我有 docker-compose.yml 文件。我如何将 apache hive 与 apache hadoop 连接起来？我想在配置单元上创建表。从 api 中提取数据并加载到 hadoop hdfs 中。还有另一种方法，比如创建 DockerFi...

docker hadoop docker-compose hive

回答 1 投票 0

Hadoop copyFromLocal 复制目录的问题

我想将整个本地目录以及一些子目录和文件复制到HDFS。 HDFS 已经包含根目录和一些带有文件的子目录。我只想添加来自 l... 的新文件...

hadoop

回答 1 投票 0

在 Hadoop 2.6.5 AWS 中运行的零数据节点

我正在尝试将文件输入/上传到 hdfs hadoop 但它给了我这个错误当我运行此命令时，我得到以下信息：- hdfs dfs -put A.txt /输入/ 23/11/08 22:19:25 警告 hdfs.DFSClient:

amazon-web-services hadoop hadoop-yarn

回答 1 投票 0

我需要从PIG HADOOP中的同一列过滤2个条件

我是猪的新手。我想要实现的目标是从 1 个表中获取 2 个值，并查找某个 id 是否同时具有这两个项目。例如产品表产品名称豆腐井仓寿司订购...

hadoop apache-pig

回答 2 投票 0

异常消息：“/tmp/hadoop-Deepshikha”不被识别为内部或外部命令、可操作程序或批处理文件

当我运行字数统计问题时，我收到此错误 C:\hadoopsetup\hadoop-3.2.4\sbin>hadoop jar C:\hadoopsetup\hadoop-3.2.4\share\hadoop\mapreduce\hadoop-mapreduce-examples-3.2.4.jar wordc...

windows hadoop mapreduce hadoop-yarn

回答 1 投票 0

Flink 任务管理器使用 Flink Kubernetes Operator 处理卷“hadoop-config-volume”失败

我正在使用 Flink Kubernetes Operator 版本 1.1.0 开发一个应用程序，但在生成的任务管理器 Pod 中收到以下错误消息：卷“hadoop-config-

kubernetes hadoop apache-flink configmap

回答 3 投票 0

在 Hadoop 2.0 中处理超过 300 万个小文本文件

我正在寻找以下问题陈述的解决方案（在HADOOP 2.2+版本中）。问题陈述：我们每天需要处理超过 300 万个文件。我们是有兴趣捕捉...

hadoop hadoop2

回答 1 投票 0

Spark 中的血统是什么？

谱系如何帮助重新计算数据？例如，我有多个节点，每个节点计算 30 分钟的数据。如果15分钟后失败，我们可以再次使用

apache-spark hadoop data-lineage

回答 5 投票 0

Spark是否支持像SQL一样的WITH子句？

我在Spark中有一个表employee_1，具有属性id和name（带数据），另一个表employee_2具有相同的属性。我想通过将 id 值加 +1 来加载数据。我的与

apache-spark hadoop pyspark apache-spark-3.0

回答 2 投票 0

我使用hadoop时无法打开localhost:8088

在hadoop中配置完所有*.xmls文件后。我使用命令： ./sbin/start-all.sh 一切顺利我使用 jps 检查进程，所有进程都在运行。但是当我访问 localhost:80...

hadoop hdfs hadoop-yarn

回答 2 投票 0

使用 jceks 密码文件的 Hadoop 凭证

创建hadoop凭证时使用： hadoop凭证创建mysql.password -provider jceks://file/home/mahadev.duary/credential.jceks 它显示以下错误：[mahadev.duary@ip-10-0-...

hadoop

回答 1 投票 0

使用密码文件的 Hadoop 凭证

我正在查看 Hadoop Credentials 的文档，如 https://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/CredentialProviderAPI.html 但是在使用第三个

hadoop

回答 1 投票 0

在 EMR 中使用密码文件的 Hadoop 凭证

使用以下命令创建hadoop凭证时：hadoop credential create mysql.password -provider jceks://file/home/mahadev.duary/credential.jceks 它显示以下错误： hadoop 凭证创建...

hadoop

回答 1 投票 0

Apache Hive 中的 DECIMAL 是固定长度类型吗？

在 Apache Hive 中如何获取 DECIMAL 的长度，如果它是固定长度类型，例如 16 字节或不是？我没有在文档中找到信息，如果它有一些方法来获取长度，比如...

java hadoop hive

回答 1 投票 0

配置 hadoop-azure abfs 驱动程序以作为 az CLI 用户使用存储帐户进行身份验证

我正在尝试弄清楚如何配置 ABFS - Azure Data Lake Storage Gen2 驱动程序，以便在通过 Azure CLI 登录的用户（普通用户）时使用 Azure 存储帐户进行身份验证。我们可以...

azure hadoop azure-data-lake-gen2

回答 1 投票 0

hadoop 相关问题

最新问题