dict方法dict.keys(),dict.items()和dict.values()返回“views”而不是list。 http://docs.python.org/dev/3.0/whatsnew//3.0.html
首先,视图与迭代器有何不同?其次,这种变化有什么好处?这只是出于性能原因吗?
这对我来说似乎并不直观,也就是说,我要求列出一些东西(给我所有的钥匙),然后我又得到了别的东西。这会让人迷惑吗?
你实际上得到了一个清单。它不是内部列表的副本,而是表现为列表但仅表示内部状态的内容。
这与它在Java中实现的方式相同(也可能是许多其他语言/环境)。
主要原因是,对于许多用例而言,返回完全独立的列表是不必要和浪费的。它需要复制整个内容(可能或许多不是很多)。
如果您只想迭代密钥,则无需创建新列表。如果您确实需要它作为单独的列表(作为副本),那么您可以从视图中轻松创建该列表。
Joachim Sauer的回答很好地解释了为什么没有退回list
。但这就留下了一个问题,为什么这些函数不会返回迭代器,就像iteritems
等在Python 2中所做的那样。
迭代器比容器更具限制性。例如,迭代器不允许多次传递;如果你尝试第二次传球,你会发现它是空的。因此,诸如elem in cont
之类的操作由容器支持,但迭代器不能支持:一旦检查元素是否在迭代器中,迭代器就会被破坏!
另一方面,获取容器通常需要制作副本,例如从字典的键中创建列表。
view
对象具有两全其美:它表现为容器,但不会复制字典!事实上,它是一种虚拟只读容器,通过链接到底层字典来工作。我不知道它是否在标准Python的其他地方出现过。
编辑:
@AntonyHatchkins:它不返回生成器函数的原因是它不允许快速的in
操作。是的,in
适用于生成器功能(当你调用它们时)。也就是说,你可以这样做:
def f():
for i in range(10):
yield i
5 in f() # True
但根据in
的定义,如果右侧是生成器,python将遍历生成器的所有n
项目 - 导致O(n)
时间复杂度。你无能为力,因为这是任意发电机唯一有意义的行为。
另一方面,在字典视图的情况下,您可以以任何方式实现in
,因为您对所管理的数据有了更多了解。实际上in
是使用哈希表以O(1)
复杂性实现的。你可以通过运行来检查它
>>> d = dict(zip(range(50000000), range(50000000)))
>>> 49999999 in d
True
>>> 49999999 in iter(d) # kinda how generator function would work
True
>>>
并注意到第一个in
与第二个in
相比有多快。
正如在相关问题中已经提到的那样,视图具有len()
方法,迭代器缺少该方法(但是列表具有它)。
返回视图而不是列表的另一个好处是,至少对于键,它在O(1)操作中具有优化的成员资格测试,而不是列表(或迭代器)的O(N)。