mapreduce 的缺点是什么？

27
投票

我宁愿问什么时候mapreduce不是合适的选择？我认为如果您按预期使用它，您不会看到任何缺点。话虽如此，在某些情况下，mapreduce 不是一个合适的选择：

如果你还想的话，你可以把以上几点当作mapreduce的缺点:)

HTH

6
投票

当您需要快速响应时。例如说

2
投票

您需要重新思考/重写诸如连接、过滤之类的琐碎操作，以在映射/归约/键/值模式中实现

1
投票

流式传输地图输出
，如果可以将其保留在内存中，这将更加高效。我最初使用 MPI 部署算法，但当我扩大一些节点开始交换时，这就是我进行转换的原因。
Namenode 跟踪分布式文件系统中所有文件的元数据
。我正在读一本 hadoop 书（Hadoop in action），其中提到雅虎估计每个文件的元数据约为 600 字节。这意味着如果您有太多文件，您的 Namenode 可能会遇到问题。
streaming API
，您必须使用java语言编写程序。例如，我从 C++ 进行了翻译。这有一些副作用，例如，与 C 相比，Java 的字符串开销很大。由于我的软件都是关于字符串的，所以这是某种缺点。

这个列表绝对不完整

，只是一些初步评论。显然，您必须记住，它是面向“大数据”的，而这正是它发挥最佳性能的地方。还有很多其他的分发框架，各有自己的特点。 MapReduce 有一些缺点，

0
投票

MapReduce

不适合实时计算和流计算

。它专为大型数据集的批处理而设计，这可能需要很长时间才能完成。