寻找使用标题中提到的模式生成元组的最快方法,即:
(1.0, 0.0, 0.0, 2.0, 0.0, 0.0, ..., N, 0.0, 0.0)
任何积极的N尊重:round(N) == N
。
最快我能想出的是使用itertools
函数将所有工作推送到C层:
from itertools import chain, repeat
def make_tuple(N):
return return tuple(chain.from_iterable(zip(map(float, range(1, round(N)+1)), repeat(0.0), repeat(0.0))))
repeat
使零,map(float, range(1, round(N)+1))
使非零值,zip
ing他们在一起使三tuple
s chain.from_iterable
变平,所以tuple
直接构造最终结果。
虽然它确实涉及临时三tuple
s(不像Patrick's answer),在CPython参考解释器上它实际上并没有创建新的tuple
s;如果在请求下一个值时没有其他对zip
的引用(并且tuple
每次都释放它的引用),则tuple
被优化为在最后结果中重用chain.from_iterable
用于新结果。
为了与其他答案进行比较,对于ipython
的N
微基准测试为150:
>>> %timeit -r5 make_tuple(150)
28.1 µs ± 1.67 µs per loop (mean ± std. dev. of 5 runs, 10000 loops each)
>>> %timeit -r5 make_tuple_tim_peters(150)
17.1 µs ± 52 ns per loop (mean ± std. dev. of 5 runs, 100000 loops each)
>>> %timeit -r5 make_tuple_julien(150)
154 µs ± 1.85 µs per loop (mean ± std. dev. of 5 runs, 10000 loops each)
>>> %timeit -r5 tuple(values_patrick_haugh(150)) # Modified to convert to float properly
40.7 µs ± 1.29 µs per loop (mean ± std. dev. of 5 runs, 10000 loops each)
我尝试了一些类似于我自己的方法的其他方法,我自己使用listcomps和genexprs,但是它们都没有达到40μs以下,所以我没有费心去发布它们。
Tim Peter's solution绝对是迄今为止发布最快的,并且不太可能被打败。作为he notes,它需要更多的内存,因为在高峰内存使用时,它需要存储整个结果tuple
和临时list
(虽然每个应该是精确大小,没有过度分配),这意味着容器的峰值内存大约是两倍什么是“需要”。我确实需要tuple
来进行全面定位(因为它不知道结果有多大),在当前的CPython中,作为实现细节,意味着大约25%的位置。节约,但不是重要的节约;如果表现很重要,我几乎总是选择蒂姆的解决方案。
后来的更新:我最终找到了能够找到Tim的答案的东西,但只能借助于numpy
,并且渐进式改进非常简单:
from numpy import arange, zeros
def make_tuple_numpy(N):
ret = zeros(3*round(N))
ret[::3] = arange(1., N+1.)
return tuple(ret.tolist())
它与Tim的答案基本相同,它只是使用numpy
来批量处理原始C基元类型(例如,np.arange
直接生成浮点形式的范围,而不创建一堆Python int
s只将它们转换为float
s),使用tolist
方法让numpy
执行转换到list
而没有Python迭代器参与,然后包装在tuple
构造函数(特殊情况下list
,所以再次没有迭代器参与)。尽管如此,优势仍然微不足道:
>>> %timeit -r5 make_tuple_numpy(150)
13.8 µs ± 158 ns per loop (mean ± std. dev. of 5 runs, 100000 loops each)
与Tim的解决方案相比,它的运行时间进一步缩短了约20%,但除非你这么做,否则导入numpy
的成本可能会节省成本。
谁知道? ;-)在CPython中,“技巧”通常涉及避免显式的Python级循环,并避免二次时间链接。这是一种方式:
def gentup(N):
NI = round(N)
assert N == NI
result = [0.] * (3 * NI)
result[::3] = map(float, range(1, NI + 1))
return tuple(result)
然后,例如,
>>> gentup(4)
(1.0, 0.0, 0.0, 2.0, 0.0, 0.0, 3.0, 0.0, 0.0, 4.0, 0.0, 0.0)
然后,所有真正的工作都以“C速度”运行,甚至float
只被查询一次(尽管被调用round(N)
次)。
这是一种不会生成任何临时元组的方法。
def values(N):
nums = range(1, N+1)
for n in nums:
yield n
yield 0
yield 0
print(tuple(values(5)))
# (1, 0, 0, 2, 0, 0, 3, 0, 0, 4, 0, 0, 5, 0, 0)