检查Python中的列表中是否有(不)

问题描述 投票:239回答:2

我在Python中有一个元组列表,并且我有一个条件,我想要仅在元组不在列表中时使用分支(如果它在列表中,那么我不想接受if分支)

if curr_x -1 > 0 and (curr_x-1 , curr_y) not in myList: 

    # Do Something

但这并不适合我。我做错了什么?

python list conditional membership
2个回答
403
投票

该错误可能在您的代码中的其他位置,因为它应该工作正常:

>>> 3 not in [2, 3, 4]
False
>>> 3 not in [4, 5, 6]
True

或者使用元组:

>>> (2, 3) not in [(2, 3), (5, 6), (9, 1)]
False
>>> (2, 3) not in [(2, 7), (7, 3), "hi"]
True

9
投票

How do I check if something is (not) in a list in Python?

最便宜和最易读的解决方案是使用in运算符(或在您的特定情况下,not in)。如文档中所述,

运营商innot in测试会员资格。如果x in sTrue的成员,x评估为s,否则Falsex not in s回归x in s的否定。

另外,

运算符not in被定义为具有in的倒数真值。

y not in x在逻辑上与not y in x相同。

这里有一些例子:

'a' in [1, 2, 3]
# False

'c' in ['a', 'b', 'c']
# True

'a' not in [1, 2, 3]
# True

'c' not in ['a', 'b', 'c']
# False

这也适用于元组,因为元组是可以清除的(因为它们也是不可变的):

(1, 2) in [(3, 4), (1, 2)]
#  True

如果RHS上的对象定义了__contains__()方法,in将在内部调用它,如文档的Comparisons部分的最后一段所述。

... innot in,由可迭代的类型支持或实现__contains__()方法。例如,你可以(但不应该)这样做:

[3, 2, 1].__contains__(1)
# True

in短路,所以如果您的元素位于列表的开头,in评估速度更快:

lst = list(range(10001))
%timeit 1 in lst
%timeit 10000 in lst  # Expected to take longer time.

68.9 ns ± 0.613 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)
178 µs ± 5.01 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

如果您想做的不仅仅是检查项目是否在列表中,还有以下选项:

  • list.index可用于检索项目的索引。如果该元素不存在,则会引发ValueError
  • 如果要计算出现次数,可以使用list.count

The XY Problem: Have you considered sets?

问自己这些问题:

  • 你需要多次检查一个项目是否在列表中吗?
  • 这个检查是在循环内完成的,还是重复调用的函数?
  • 您列表中存储的项目是否可以播放? IOW,你能打电话给hash吗?

如果你对这些问题回答“是”,那么你应该使用set代替。 ins的list成员资格测试是O(n)时间复杂度。这意味着python必须对列表进行线性扫描,访问每个元素并将其与搜索项进行比较。如果您反复执行此操作,或者列表很大,则此操作将产生开销。

另一方面,set对象散列它们的值以进行恒定时间成员资格检查。检查也使用in完成:

1 in {1, 2, 3} 
# True

'a' not in {'a', 'b', 'c'}
# False

(1, 2) in {('a', 'c'), (1, 2)}
# True

如果你不幸的是你正在搜索/不搜索的元素位于列表的末尾,python将扫描列表到最后。从以下时间可以看出这一点:

l = list(range(100001))
s = set(l)

%timeit 100000 in l
%timeit 100000 in s

2.58 ms ± 58.9 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
101 ns ± 9.53 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)

提醒一下,只要您存储和查找的元素可以清洗,这是一个合适的选项。 IOW,它们要么必须是不可变类型,要么是实现__hash__的对象。

© www.soinside.com 2019 - 2024. All rights reserved.