我使用Rumen mine作业历史文件,包含job-trace.json和job-topology.json。 GirdMix用法喜欢:
$HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/share/hadoop/tools/lib/hadoop-gridmix-2.7.3.jar -libjars $HADOOP_HOME/share/hadoop/tools/lib/hadoop-rumen-2.7.3.jar -Dgridmix.compression-emulation.enable=false <iopath> <trace>
并且,表示Gridmix的工作目录,所以我用:file:///home/hadoop/input
提供,表示从日志文件中提取的跟踪文件,用file:///home/hadoop/rumen/job-trace-1hr.json
提供。
最后,遇到以下例外情况:
2019-03-07 16:37:12,495 ERROR [main] gridmix.Gridmix (Gridmix.java:start(534)) - Startup failed. java.io.IOException: Found no satisfactory file in file:/home//hadoop/input
2019-03-07 16:37:13,040 INFO [main] util.ExitUtil (ExitUtil.java:terminate(124)) - Exiting with status 2
2019-03-07 16:37:13,041 INFO [Thread-1] gridmix.Gridmix (Gridmix.java:run(657)) - Exiting...
那么这个参数是什么样的,或者如何使用它?
任何人都可以有一些想法?
谢谢。
我发现这是我自己不正确的用法;由于输入数据太小,我检查了gridmix参数的使用情况。
gridmix.min.file.size | The minimum size of the input files. The default limit is 128 MiB. Tweak this parameter if you see an error-message like "Found no satisfactory file" while testing GridMix with a relatively-small input data-set.
所以,我调整了更大的输入数据。使用 - 生成10G。
谢谢。