Python 中是否存在可以将递增的整数列表转换为范围列表的东西
例如给定集合 {0, 1, 2, 3, 4, 7, 8, 9, 11} 我想得到 { {0,4}, {7,9}, {11,11} }。
我可以编写一个程序来做到这一点,但想知道Python中是否有内置函数
itertools.groupby()
会产生一个简洁但棘手的实现:
import itertools
def ranges(i):
for a, b in itertools.groupby(enumerate(i), lambda pair: pair[1] - pair[0]):
b = list(b)
yield b[0][1], b[-1][1]
print(list(ranges([0, 1, 2, 3, 4, 7, 8, 9, 11])))
输出:
[(0, 4), (7, 9), (11, 11)]
这是对非常优雅的答案的改进。这个涵盖了 non-unique 和 non-sorted 输入,并且也兼容 python3:
import itertools
def to_ranges(iterable):
iterable = sorted(set(iterable))
for key, group in itertools.groupby(enumerate(iterable),
lambda t: t[1] - t[0]):
group = list(group)
yield group[0][1], group[-1][1]
示例:
>>> x
[44, 45, 2, 56, 23, 11, 3, 4, 7, 9, 1, 2, 2, 11, 12, 13, 45]
>>> print( list(to_ranges(x)))
[(1, 4), (7, 7), (9, 9), (11, 13), (23, 23), (44, 45), (56, 56)]
您可以使用列表理解与生成器表达式以及enumerate()和itertools.groupby():
的组合>>> import itertools
>>> l = [0, 1, 2, 3, 4, 7, 8, 9, 11]
>>> [[t[0][1], t[-1][1]] for t in
... (tuple(g[1]) for g in itertools.groupby(enumerate(l), lambda (i, x): i - x))]
[[0, 4], [7, 9], [11, 11]]
首先,
enumerate()
将从列表项及其各自的索引构建元组:
>>> [t for t in enumerate(l)]
[(0, 0), (1, 1), (2, 2), (3, 3), (4, 4), (5, 7), (6, 8), (7, 9), (8, 11)]
然后
groupby()
将使用这些元组的索引和值之间的差异对这些元组进行分组(这对于连续值来说是相等的):
>>> [tuple(g[1]) for g in itertools.groupby(enumerate(l), lambda (i, x): i - x)]
[((0, 0), (1, 1), (2, 2), (3, 3), (4, 4)), ((5, 7), (6, 8), (7, 9)), ((8, 11),)]
从那里,我们只需要根据每个组的第一个和最后一个元组的值构建列表(如果该组仅包含一个项目,则该列表将是相同的)。
您还可以使用
[(t[0][1], t[-1][1]) ...]
来构建范围元组列表,而不是嵌套列表,甚至可以使用 ((t[0][1], t[-1][1]) ...)
将整个表达式转换为可迭代的 generator
,它将动态地延迟构建范围元组。
生成范围对:
def ranges(lst):
s = e = None
r = []
for i in sorted(lst):
if s is None:
s = e = i
elif i == e or i == e + 1:
e = i
else:
r.append((s, e))
s = e = i
if s is not None:
r.append((s, e))
return r
示例:
>>> lst = [1, 5, 6, 7, 12, 15, 16, 17, 18, 30]
>>> print repr(ranges(lst))
[(1, 1), (5, 7), (12, 12), (15, 18), (30, 30)]
作为发电机:
def gen_ranges(lst):
s = e = None
for i in sorted(lst):
if s is None:
s = e = i
elif i == e or i == e + 1:
e = i
else:
yield (s, e)
s = e = i
if s is not None:
yield (s, e)
示例:
>>> lst = [1, 5, 6, 7, 12, 15, 16, 17, 18, 30]
>>> print repr(','.join(['%d' % s if s == e else '%d-%d' % (s, e) for (s, e) in gen_ranges(lst)]))
'1,5-7,12,15-18,30'
该发电机:
def ranges(p):
q = sorted(p)
i = 0
for j in xrange(1,len(q)):
if q[j] > 1+q[j-1]:
yield (q[i],q[j-1])
i = j
yield (q[i], q[-1])
sample = [0, 1, 2, 3, 4, 7, 8, 9, 11]
print list(ranges(sample))
print list(ranges(reversed(sample)))
print list(ranges([1]))
print list(ranges([2,3,4]))
print list(ranges([0,2,3,4]))
print list(ranges(5*[1]))
产生这些结果:
[(0, 4), (7, 9), (11, 11)]
[(0, 4), (7, 9), (11, 11)]
[(1, 1)]
[(2, 4)]
[(0, 0), (2, 4)]
[(1, 1)]
请注意,重复数字的运行会被压缩。我不知道这是否是你想要的。如果没有,请将
>
更改为 !=
。
我理解你的问题。我研究了
itertools
并试图想出一个可以用几行Python完成的解决方案,这将符合“几乎是内置的”,但我想不出任何东西。
由于已经有两年左右的时间没有新的答案了,这里有一个适合僵尸爱好者的答案!
如果你不想使用 itertools 或生成器,下面使用逻辑(!)。它使用一个集合(参见问题!)作为输入,并返回一个正确范围的列表作为结果;不过,调整代码以适应它很容易。
def ranges(l_set: set) ->list:
rb_set = sorted(l_set - {i +1 for i in l_set})
re_set = sorted(l_set - {i -1 for i in l_set})
return [range(rb_set[i], re_set[i]+1) for i in range(len(rb_set))]
例如:
>>>ranges({6, 9, 10, 7, 8, 2, 3, 14})
[range(2, 4), range(6, 11), range(14, 15)]
>>>ranges({6, 7, 3, 15, 8, 5, 12, 0, 12, 7, 15, 6, 14, 8, 16})
[range(0, 1), range(3, 4), range(5, 9), range(12, 13), range(14, 17)]
相关问题针对步长大小不是 1 的情况以及该问题的几乎重复项此处。 here给出了任一情况下表现良好的解决方案。
没有任何内置的东西,也没有在我所知道的任何库中。我知道这不是很有帮助,但我从来没有遇到过像你想要的那样的东西。
这里至少有一些关于你的程序的想法(在C++中,但它可以给你一些其他的想法):
如果Python中没有这样的功能,这里有一个实现
p = []
last = -2
start = -1
for item in list:
if item != last+1:
if start != -1:
p.append([start, last])
start = item
last = item
p.append([start, last])
说得短一些:
ranges=lambda l:map(lambda x:(x[0][1],x[-1][1]),map(lambda (x,y):list(y),itertools.groupby(enumerate(l),lambda (x,y):x-y)))
我认为其他答案很难理解,而且可能效率低下。希望这更容易、更快。
def ranges(ints):
ints = sorted(set(ints))
range_start = previous_number = ints[0]
for number in ints[1:]:
if number == previous_number + 1:
previous_number = number
else:
yield range_start, previous_number
range_start = previous_number = number
yield range_start, previous_number
使用列表理解:
s = {0,1,2,3,4,7,8,9,11}
r = [(a,b)
for l in [sorted([i for i in s if {i-1,i+1} - s])]
for a,b in zip(l[::2],l[1::2]+[l[-1]])]
print(r)
产量
[(0, 4), (7, 9), (11, 11)]