在hdfs文件上运行awk脚本并将结果文件持久存储在hdfs中

问题描述投票：1回答：1

我在hdfs中有一个文件，需要在其上运行awk脚本。然后，我将结果保存到另一个hdfs位置。一种方法是在本地下载hdfs文件，然后运行awk操作。另一种方法是将猫在hdfs文件上的结果通过管道传输到awk。

有没有一种方法可以将这种责任委托给map-reduce框架，因为这些文件非常大，并且具有数百万条记录。