Hadoop Mapreduce错误输入路径不存在：hdfs：// localhost：54310 / user / hduser / input“

Question

我在Ubuntu Linux 15.04中安装了hadoop 2.6，运行正常。但是，当我运行示例测试mapreduce程序时，它给出以下错误：

org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: hdfs://localhost:54310/user/hduser/input.

请帮助我。以下是错误的完整详细信息。

hduser@krishadoop:/usr/local/hadoop/sbin$ hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar wordcount input output
Picked up JAVA_TOOL_OPTIONS: -javaagent:/usr/share/java/jayatanaag.jar 
15/08/24 15:22:37 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
15/08/24 15:22:38 INFO Configuration.deprecation: session.id is deprecated. Instead, use dfs.metrics.session-id
15/08/24 15:22:38 INFO jvm.JvmMetrics: Initializing JVM Metrics with processName=JobTracker, sessionId=
15/08/24 15:22:39 INFO mapreduce.JobSubmitter: Cleaning up the staging area file:/app/hadoop/tmp/mapred/staging/hduser1122930879/.staging/job_local1122930879_0001
org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: hdfs://localhost:54310/user/hduser/input
    at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:321)
    at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.listStatus(FileInputFormat.java:264)
    at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.getSplits(FileInputFormat.java:385)
    at org.apache.hadoop.mapreduce.JobSubmitter.writeNewSplits(JobSubmitter.java:597)
    at org.apache.hadoop.mapreduce.JobSubmitter.writeSplits(JobSubmitter.java:614)
    at org.apache.hadoop.mapreduce.JobSubmitter.submitJobInternal(JobSubmitter.java:492)
    at org.apache.hadoop.mapreduce.Job$10.run(Job.java:1296)
    at org.apache.hadoop.mapreduce.Job$10.run(Job.java:1293)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:415)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1628)
    at org.apache.hadoop.mapreduce.Job.submit(Job.java:1293)
    at org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:1314)
    at org.apache.hadoop.examples.WordCount.main(WordCount.java:87)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:606)
    at org.apache.hadoop.util.ProgramDriver$ProgramDescription.invoke(ProgramDriver.java:71)
    at org.apache.hadoop.util.ProgramDriver.run(ProgramDriver.java:144)
    at org.apache.hadoop.examples.ExampleDriver.main(ExampleDriver.java:74)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:606)
    at org.apache.hadoop.util.RunJar.run(RunJar.java:221)
    at org.apache.hadoop.util.RunJar.main(RunJar.java:136)

Answer 1

好像你提到了错误的输入路径。 Hadoop正在/user/hduser/input上搜索输入路径。 Hadoop也遵循unix之类的树形结构。如果你只是提到一个目录input它将被视为/user/{username}/input。

hadoop fs -mkdir -p /user/hduser/input

hadoop fs -put <datafile>  /user/hduser/input

Answer 2

如果您在物理上看到此路径（文件）并仍然收到错误，则可能与本地文件系统和Hadoop分布式文件系统（HDFS）混淆。为了运行这个map-reduce，这个文件应该位于HDFS中（仅在本地文件系统内部定位不会这样做。）。

您可以通过此命令将本地文件系统文件导入HDFS。

hadoop fs -put <local_file_path> <HDFS_diresctory>

您通过此命令确认导入的文件存在于HDFS中。

hadoop fs -ls <HDFS_path>

Answer 3

您必须在执行hadoop作业之前创建并上传输入。例如，如果您需要上传input.txt文件，则应执行以下操作：

$HADOOP_HOME/bin/hdfs dfs -mkdir /user/hduser/input
$HADOOP_HOME/bin/hdfs dfs -copyFromLocal $HADOOP_HOME/input.txt /user/hduser/input/input.txt

第一行创建目录，另一行将输入文件上传到hdfs（hadoop fylesystem）。

Answer 4

您需要以本地模式启动Pig而不是群集节点：

猪-x本地

Answer 5

使用输入和输出文件/目录编译任何jar文件时，应确保已创建输入文件（在指定的路径中）并且输出文件不存在。

如果要将文本文件作为输入文件，首先将文本文件从本地文件系统复制到hdfs并使用以下命令对其进行编译

hadoop fs -copyFromLocal /input.txt /user/hduser/input.txt
/usr/local/hadoop/sbin$ yarn jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar wordcount /user/hduser/input.txt /output

/input.txt可以替换为任何文本文件的地址。

Answer 6

程序无法找到输入的Hadoop路径。它在本地系统文件而不是Hadoop的DFS中搜索。

当您的程序能够找到HDFS位置时，此问题将消失。我们需要让程序理解配置文件中给出的HDFS位置。为此，请在程序代码中添加这些行。

Configuration conf = new Configuration();

conf.addResource(new Path("/usr/local/hadoop/hadoop-2.7.3/etc/hadoop/core-site.xml"));
conf.addResource(new Path("/usr/local/hadoop/hadoop-2.7.3/etc/hadoop/hdfs-site.xml"));

Answer 7

你应该在HDFS中创建目录：例如，“hadoop fs -mkdir / input_dir”
然后当你运行MapReduce程序时。你应该提到输入目录的绝对路径，所以格式应该是： hadoop jar jarFileName.jar className /input_dir /outputdir对

以下是错误的，因为它是相对路径hadoop jar jarFileName.jar className input_dir outputdir错误

Answer 8

如果您在日志中找到/bin/bash: /bin/java: No such file or directory，请尝试在/etc/hadoop/hadoop-env.sh中设置JAVA_HOME

Hadoop Mapreduce错误输入路径不存在：hdfs：// localhost：54310 / user / hduser / input“

问题描述投票：6回答：8

8个回答

最新问题

Hadoop Mapreduce错误输入路径不存在：hdfs：// localhost：54310 / user / hduser / input“

问题描述 投票：6回答：8

8个回答

最新问题

问题描述投票：6回答：8