Python 3.0 - dict方法返回视图 - 为什么?

问题描述 投票:12回答:3

dict方法dict.keys(),dict.items()和dict.values()返回“views”而不是list。 http://docs.python.org/dev/3.0/whatsnew//3.0.html

首先,视图与迭代器有何不同?其次,这种变化有什么好处?这只是出于性能原因吗?

这对我来说似乎并不直观,也就是说,我要求列出一些东西(给我所有的钥匙),然后我又得到了别的东西。这会让人迷惑吗?

python-3.x dictionary iterator language-features dictview
3个回答
13
投票

你实际上得到了一个清单。它不是内部列表的副本,而是表现为列表但仅表示内部状态的内容。

这与它在Java中实现的方式相同(也可能是许多其他语言/环境)。

主要原因是,对于许多用例而言,返回完全独立的列表是不必要和浪费的。它需要复制整个内容(可能或许多不是很多)。

如果您只想迭代密钥,则无需创建新列表。如果您确实需要它作为单独的列表(作为副本),那么您可以从视图中轻松创建该列表。


6
投票

Joachim Sauer的回答很好地解释了为什么没有退回list。但这就留下了一个问题,为什么这些函数不会返回迭代器,就像iteritems等在Python 2中所做的那样。

迭代器比容器更具限制性。例如,迭代器不允许多次传递;如果你尝试第二次传球,你会发现它是空的。因此,诸如elem in cont之类的操作由容器支持,但迭代器不能支持:一旦检查元素是否在迭代器中,迭代器就会被破坏!

另一方面,获取容器通常需要制作副本,例如从字典的键中创建列表。

view对象具有两全其美:它表现为容器,但不会复制字典!事实上,它是一种虚拟只读容器,通过链接到底层字典来工作。我不知道它是否在标准Python的其他地方出现过。

编辑:

@AntonyHatchkins:它不返回生成器函数的原因是它不允许快速的in操作。是的,in适用于生成器功能(当你调用它们时)。也就是说,你可以这样做:

def f():
  for i in range(10):
    yield i

5 in f() # True

但根据in的定义,如果右侧是生成器,python将遍历生成器的所有n项目 - 导致O(n)时间复杂度。你无能为力,因为这是任意发电机唯一有意义的行为。

另一方面,在字典视图的情况下,您可以以任何方式实现in,因为您对所管理的数据有了更多了解。实际上in是使用哈希表以O(1)复杂性实现的。你可以通过运行来检查它

>>> d = dict(zip(range(50000000), range(50000000)))
>>> 49999999 in d
True
>>> 49999999 in iter(d) # kinda how generator function would work
True
>>>

并注意到第一个in与第二个in相比有多快。


0
投票

正如在相关问题中已经提到的那样,视图具有len()方法,迭代器缺少该方法(但是列表具有它)。

返回视图而不是列表的另一个好处是,至少对于键,它在O(1)操作中具有优化的成员资格测试,而不是列表(或迭代器)的O(N)。

© www.soinside.com 2019 - 2024. All rights reserved.