Python 3.0 - dict方法返回视图 - 为什么？

Question

dict方法dict.keys（），dict.items（）和dict.values（）返回“views”而不是list。 http://docs.python.org/dev/3.0/whatsnew//3.0.html

首先，视图与迭代器有何不同？其次，这种变化有什么好处？这只是出于性能原因吗？

这对我来说似乎并不直观，也就是说，我要求列出一些东西（给我所有的钥匙），然后我又得到了别的东西。这会让人迷惑吗？

Answer 1

你实际上得到了一个清单。它不是内部列表的副本，而是表现为列表但仅表示内部状态的内容。

这与它在Java中实现的方式相同（也可能是许多其他语言/环境）。

主要原因是，对于许多用例而言，返回完全独立的列表是不必要和浪费的。它需要复制整个内容（可能或许多不是很多）。

如果您只想迭代密钥，则无需创建新列表。如果您确实需要它作为单独的列表（作为副本），那么您可以从视图中轻松创建该列表。

Answer 2

Joachim Sauer的回答很好地解释了为什么没有退回list。但这就留下了一个问题，为什么这些函数不会返回迭代器，就像iteritems等在Python 2中所做的那样。

迭代器比容器更具限制性。例如，迭代器不允许多次传递;如果你尝试第二次传球，你会发现它是空的。因此，诸如elem in cont之类的操作由容器支持，但迭代器不能支持：一旦检查元素是否在迭代器中，迭代器就会被破坏！

另一方面，获取容器通常需要制作副本，例如从字典的键中创建列表。

view对象具有两全其美：它表现为容器，但不会复制字典！事实上，它是一种虚拟只读容器，通过链接到底层字典来工作。我不知道它是否在标准Python的其他地方出现过。

编辑：

@AntonyHatchkins：它不返回生成器函数的原因是它不允许快速的in操作。是的，in适用于生成器功能（当你调用它们时）。也就是说，你可以这样做：

def f():
  for i in range(10):
    yield i

5 in f() # True

但根据in的定义，如果右侧是生成器，python将遍历生成器的所有n项目 - 导致O(n)时间复杂度。你无能为力，因为这是任意发电机唯一有意义的行为。

另一方面，在字典视图的情况下，您可以以任何方式实现in，因为您对所管理的数据有了更多了解。实际上in是使用哈希表以O(1)复杂性实现的。你可以通过运行来检查它

>>> d = dict(zip(range(50000000), range(50000000)))
>>> 49999999 in d
True
>>> 49999999 in iter(d) # kinda how generator function would work
True
>>>

并注意到第一个in与第二个in相比有多快。

Answer 3

正如在相关问题中已经提到的那样，视图具有len()方法，迭代器缺少该方法（但是列表具有它）。

返回视图而不是列表的另一个好处是，至少对于键，它在O（1）操作中具有优化的成员资格测试，而不是列表（或迭代器）的O（N）。