我正在进行Hadoop性能分析,并且正在Hadoop上运行一些基准测试。令人惊讶的是,Grep花费的字数统计时间几乎是其运行时间的1/10,这非常不直观。谁能解释这是真的吗?
map-reduce惯用语中的许多工作是映射器和化简器之间的通信。