我试图箱体采用山坳MNIST图像和行明智的最小和最大非零值,为每个图像。我能做到这一点使用for循环,但我想知道,如果它可以在不循环来完成。下面是一些玩具数据
arr = np.array([[[0, 0, 0, 0, 0],
[0, 1, 1, 1, 0],
[0, 1, 0, 1, 0],
[0, 1, 0, 0, 0],
[0, 0, 0, 0, 0]],
[[0, 0, 0, 0, 0],
[0, 1, 1, 0, 0],
[0, 1, 0, 0, 0],
[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0]]])
对于前。 ARR的[0]我要检索的非零图象的边界,
row_min, row_max, col_min, col_max = [1, 3, 1, 3]
我使用了一个for循环,如下所示,它的作品这样做
for val in arr:
row_max, col_max = np.apply_along_axis(max,1,np.nonzero(val))
row_min, col_min = np.apply_along_axis(min,1,np.nonzero(val))
val[row_min:row_max+1,[col_min,col_max]] = 1
val[[row_min,row_max],col_min:col_max+1] = 1
不过,我想避免的for循环(我现在有一个单独的函数上面的代码),并有这种转变的内联。
np.apply_over_axes
不工作对我来说np.nonzero不采取任何轴值。我不知道如何做到分开沿着第一轴阵列(然后进行申请np.apply_along_axis(min,1,np.nonzero(val))
每个二维数组时,我们就会有)
这里有一个与argmax
效率 -
def get3Dboundaries(arr):
row_start = arr.any(2).argmax(1)
row_end = arr.shape[1]-arr.any(2)[:,::-1].argmax(1)-1
col_start = arr.any(1).argmax(1)
col_end = arr.shape[2]-arr.any(1)[:,::-1].argmax(1)-1
return np.c_[row_start,row_end,col_start,col_end]
样品运行 -
In [61]: arr
Out[61]:
array([[[0, 0, 0, 0, 0],
[0, 1, 1, 1, 0],
[0, 1, 0, 1, 0],
[0, 1, 0, 0, 0],
[0, 0, 0, 0, 0]],
[[0, 0, 0, 0, 0], # different second slice for variety
[1, 1, 1, 1, 0],
[0, 1, 0, 1, 0],
[0, 0, 0, 1, 0],
[0, 0, 0, 1, 0]]])
In [62]: get3Dboundaries(arr)
Out[62]:
array([[1, 3, 1, 3],
[1, 4, 0, 3]])
我们可以把它处理所有零的情况下使用无效符,说-1
,像这样 -
def get3Dboundaries_v2(arr):
row_start = arr.any(2).argmax(1)
row_end = arr.shape[1]-arr.any(2)[:,::-1].argmax(1)-1
col_start = arr.any(1).argmax(1)
col_end = arr.shape[2]-arr.any(1)[:,::-1].argmax(1)-1
out = np.c_[row_start,row_end,col_start,col_end]
return np.where(arr.any((1,2))[:,None],out,-1)
样品运行 -
In [76]: arr
Out[76]:
array([[[0, 0, 0, 0, 0],
[0, 1, 1, 1, 0],
[0, 1, 0, 1, 0],
[0, 1, 0, 0, 0],
[0, 0, 0, 0, 0]],
[[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0],
[0, 0, 0, 0, 0]]])
In [78]: get3Dboundaries_v2(arr)
Out[78]:
array([[ 1, 3, 1, 3],
[-1, -1, -1, -1]])