替换大于某个值的Python NumPy Array的所有元素

问题描述 投票:147回答:6

我有一个2D NumPy数组,并希望将其中的所有值替换为大于或等于阈值T的255.0。据我所知,最基本的方式是:

shape = arr.shape
result = np.zeros(shape)
for x in range(0, shape[0]):
    for y in range(0, shape[1]):
        if arr[x, y] >= T:
            result[x, y] = 255
  1. 什么是最简洁和pythonic的方式来做到这一点?
  2. 有没有更快(可能不那么简洁和/或更少pythonic)的方式来做到这一点?

这将是用于人体头部的MRI扫描的窗口/水平调整子程序的一部分。 2D numpy数组是图像像素数据。

python arrays numpy replace condition
6个回答
261
投票

我认为最快和最简洁的方法是使用NumPy的内置Fancy索引。如果你有一个名为ndarrayarr,你可以用值>255替换所有元素x,如下所示:

arr[arr > 255] = x

我在我的机器上用500 x 500随机矩阵运行它,用5替换所有值> 0.5,平均花费7.59ms。

In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)
In [3]: timeit A[A > 0.5] = 5
100 loops, best of 3: 7.59 ms per loop

40
投票

既然你真的想要一个不同的数组,那就是arrarr < 255255,这可以简单地完成:

result = np.minimum(arr, 255)

更一般地说,对于较低和/或上限:

result = np.clip(arr, 0, 255)

如果您只想访问超过255的值,或者更复杂的东西,@ mtitan8的答案更为通用,但np.clipnp.minimum(或np.maximum)更适合您的情况:

In [292]: timeit np.minimum(a, 255)
100000 loops, best of 3: 19.6 µs per loop

In [293]: %%timeit
   .....: c = np.copy(a)
   .....: c[a>255] = 255
   .....: 
10000 loops, best of 3: 86.6 µs per loop

如果你想在原地进行(即修改arr而不是创建result),你可以使用outnp.minimum参数:

np.minimum(arr, 255, out=arr)

要么

np.clip(arr, 0, 255, arr)

out=名称是可选的,因为参数的顺序与函数的定义相同。)

对于就地修改,布尔索引加速了很多(不必单独制作然后修改副本),但仍然没有minimum那么快:

In [328]: %%timeit
   .....: a = np.random.randint(0, 300, (100,100))
   .....: np.minimum(a, 255, a)
   .....: 
100000 loops, best of 3: 303 µs per loop

In [329]: %%timeit
   .....: a = np.random.randint(0, 300, (100,100))
   .....: a[a>255] = 255
   .....: 
100000 loops, best of 3: 356 µs per loop

为了比较,如果你想用最小值和最大值来限制你的值,没有clip,你必须做两次,比如像

np.minimum(a, 255, a)
np.maximum(a, 0, a)

要么,

a[a>255] = 255
a[a<0] = 0

10
投票

我认为你可以通过使用where函数实现最快:

例如,在numpy数组中查找大于0.2的项并将其替换为0:

import numpy as np

nums = np.random.rand(4,3)

print np.where(nums > 0.2, 0, nums)

8
投票

你可以考虑使用numpy.putmask

np.putmask(arr, arr>=T, 255.0)

这是与Numpy的内置索引的性能比较:

In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)

In [3]: timeit np.putmask(A, A>0.5, 5)
1000 loops, best of 3: 1.34 ms per loop

In [4]: timeit A[A > 0.5] = 5
1000 loops, best of 3: 1.82 ms per loop

8
投票

另一种方法是使用qazxsw poi进行就地替换并使用多维数组:

np.place

1
投票

您还可以使用import numpy as np arr = np.arange(6).reshape(2, 3) np.place(arr, arr == 0, -10) &(和/或)来获得更大的灵活性:

5到10之间的值:|

值大于10或小于5:A[(A>5)&(A<10)]

© www.soinside.com 2019 - 2024. All rights reserved.