这是我第一次使用 hadoop,所以我开始使用基本的字数统计程序。在我的本地机器上它工作得很好。真正的问题是我无法在 hadoop 集群上运行。
这是我在终端上运行的:
hadoop jar /home/hdoop/hadoop-3.3.4/share/hadoop/tools/lib/hadoop-streaming-3.3.4.jar \
-input /main/data.txt \
-output /main/output \
-mapper /home/hdoop/mapper.py \
-reducer /home/hdoop/reducer.py
这就是我被困的地方:
我去了
http://localhost:8088/cluster/apps
但它停留在0几个小时。
YARN 中的“活动节点”为零,“总资源”为零;因此,您的应用程序将暂停,直到 ResourceManagers 报告健康的 NodeManagers。
检查 NodeManager 进程日志,看看它为什么不健康。