如何获得所有数组边缘?

问题描述 投票:4回答:5

我有一个n x n数组,并希望接收其轮廓值。例如,

[4,5,6,7]

[2,2,6,3]

[4,4,9,4]

[8,1,6,1]

从此,我会得到这个

[4,5,6,7,3,4,1,6,1,8,4,2]

(见粗体)

从本质上讲,获取2D阵列边缘所有值的一维数组的最有效方法是什么?我问,因为我假设有一个numPy函数可以帮助解决这个问题(我还没有找到它!),而不是手动循环?

python arrays numpy
5个回答
2
投票
In [1]: arr=np.arange(16).reshape(4,4)
In [2]: arr
Out[2]: 
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15]])

这样做的一种相对直接的方式 - 顺时针顺序是:

In [5]: alist=[arr[0,:-1], arr[:-1,-1], arr[-1,::-1], arr[-2:0:-1,0]]
In [6]: alist
Out[6]: [array([0, 1, 2]), array([ 3,  7, 11]), array([15, 14, 13, 12]), array([8, 4])]
In [7]: np.concatenate(alist)
Out[7]: array([ 0,  1,  2,  3,  7, 11, 15, 14, 13, 12,  8,  4])

从某种意义上说,它是一个循环,因为我必须构建4个切片。但如果4与n相比较小,这是一个很小的代价。它必须在某种程度上连接。

如果顺序无关紧要,我们可以简化一些切片(例如,忘记相反的顺序等)。

alist=[arr[0,:], arr[1:,-1], arr[-1,:-1], arr[1:-1,0]]

如果我不关心订单,或重复计算我可以使用的角落:

np.array([arr[[0,n],:], arr[:,[0,n]].T]).ravel()

消除重复的角落

In [18]: np.concatenate((arr[[0,n],:].ravel(), arr[1:-1,[0,n]].ravel()))
Out[18]: array([ 0,  1,  2,  3, 12, 13, 14, 15,  4,  7,  8, 11])

2
投票

这是一种矢量化方法,用于创建这种边缘像素/元素的掩模,然后简单地索引到数组中以获取这些 -

def border_elems(a, W): # Input array : a, Edgewidth : W
    n = a.shape[0]
    r = np.minimum(np.arange(n)[::-1], np.arange(n))
    return a[np.minimum(r[:,None],r)<W]

同样,这并不是完全意味着性能,而是更多适用于您可能改变边缘宽度或仅创建此类边缘元素的掩模的情况。掩码将是:np.minimum(r[:,None],r)<W在最后一步创建。

样品运行 -

In [89]: a
Out[89]: 
array([[49, 49, 12, 90, 42],
       [91, 58, 92, 16, 78],
       [97, 19, 58, 84, 84],
       [86, 31, 80, 78, 69],
       [29, 95, 38, 51, 92]])

In [90]: border_elems(a,1)
Out[90]: array([49, 49, 12, 90, 42, 91, 78, 97, 84, 86, 69, 29, 95, 38, 51, 92])

In [91]: border_elems(a,2) # Note this will select all but the center one : 58
Out[91]: 
array([49, 49, 12, 90, 42, 91, 58, 92, 16, 78, 97, 19, 84, 84, 86, 31, 80,
       78, 69, 29, 95, 38, 51, 92])

对于通用形状,我们可以这样扩展 -

def border_elems_generic(a, W): # Input array : a, Edgewidth : W
    n1 = a.shape[0]
    r1 = np.minimum(np.arange(n1)[::-1], np.arange(n1))
    n2 = a.shape[1]
    r2 = np.minimum(np.arange(n2)[::-1], np.arange(n2))
    return a[np.minimum(r1[:,None],r2)<W]

基于2D convolution的通用形状解决方案

这是另一个与2D convolution,照顾通用的2D形状 -

from scipy.signal import convolve2d

k = np.ones((3,3),dtype=int) # kernel
boundary_elements = a[convolve2d(np.ones(a.shape,dtype=int),k,'same')<9]

样品运行 -

In [36]: a
Out[36]: 
array([[4, 3, 8, 3, 1],
       [1, 5, 6, 6, 7],
       [9, 5, 2, 5, 9],
       [2, 2, 8, 4, 7]])

In [38]: k = np.ones((3,3),dtype=int)

In [39]: a[convolve2d(np.ones(a.shape,dtype=int),k,'same')<9]
Out[39]: array([4, 3, 8, 3, 1, 1, 7, 9, 9, 2, 2, 8, 4, 7])

1
投票

假设您的列表采用以下格式:

l = [
     [4, 5, 6, 7],
     [2, 2, 6, 3],
     [4, 4, 9, 4],
     [8, 1, 6, 1]
    ]

使用列表推导,您可以使用此快速单行程获得所需内容:

out = list(l[0]) +  # [4, 5, 6, 7]
      list([i[-1] for i in l[1:-1]]) +  # [3, 4]
      list(reversed(l[-1])) +  # [1, 6, 1, 8]
      list(reversed([i[0] for i in l[1:-1]])) # [4, 2]

print(out)  # gives [4, 5, 6, 7, 3, 4, 1, 6, 1, 8, 4, 2]

无论你有一个普通的python列表还是一个numpy数组,这都有效。

关于效率,在20000x20000矩阵上使用%timeit,这种方法采用16.4ms

l = np.random.random(20000, 20000)
%timeit list(l[0]) + list(...) + list(...) + list(...)
100 loops, best of 3: 16.4 ms per loop

我确信有更有效的方法来完成这项任务,但我认为这对单线解决方案来说非常好。


1
投票

它可能比其他答案中提到的替代品慢,因为它创建了一个掩码(这是我的用例),它可以在你的情况下使用:

def mask_borders(arr, num=1):
    mask = np.zeros(arr.shape, bool)
    for dim in range(arr.ndim):
        mask[tuple(slice(0, num) if idx == dim else slice(None) for idx in range(arr.ndim))] = True  
        mask[tuple(slice(-num, None) if idx == dim else slice(None) for idx in range(arr.ndim))] = True  
    return mask

正如已经说过的,这会创建并返回一个掩盖边界的maskTrue):

>>> mask_borders(np.ones((5,5)))
array([[ True,  True,  True,  True,  True],
       [ True, False, False, False,  True],
       [ True, False, False, False,  True],
       [ True, False, False, False,  True],
       [ True,  True,  True,  True,  True]], dtype=bool)

>>> # Besides supporting arbitary dimensional input it can mask multiple border rows/cols
>>> mask_borders(np.ones((5,5)), 2)
array([[ True,  True,  True,  True,  True],
       [ True,  True,  True,  True,  True],
       [ True,  True, False,  True,  True],
       [ True,  True,  True,  True,  True],
       [ True,  True,  True,  True,  True]], dtype=bool)

要获得“border”值,需要将boolean indexing应用于您的数组:

>>> arr = np.array([[4,5,6,7], [2,2,6,3], [4,4,9,4], [8,1,6,1]])

>>> arr[mask_borders(arr)]
array([4, 5, 6, 7, 2, 3, 4, 4, 8, 1, 6, 1])

1
投票

您也可以使用itertools.groupbylist comprehension,如下例所示:

a = [
        [4,5,6,7],
        [2,2,6,3],
        [4,4,9,4],
        [8,1,6,1],
    ]

from itertools import groupby

def edges(a = list):
    final, i = [], []
    for k, _ in groupby(a[1:-1], lambda x : [x[0], x[-1]]):
        i += k

    return a[0] + [k for n in range(1,len(i), 2) for k in i[n:n+1]] + a[-1][::-1] + [k for n in range(0, len(i), 2) for k in i[n:n+1] ][::-1]

输出:

print(edges(a))
>>> [4, 5, 6, 7, 3, 4, 1, 6, 1, 8, 4, 2]

使用timeit测试:

a = [
        [4,5,6,7],
        [2,2,6,3],
        [4,4,9,4],
        [8,1,6,1],
    ]

from itertools import groupby

def edges():
    final, i = [], []
    for k, _ in groupby(a[1:-1], lambda x : [x[0], x[-1]]):
        i += k

    return a[0] + [k for n in range(1,len(i), 2) for k in i[n:n+1]] + a[-1][::-1] + [k for n in range(0, len(i), 2) for k in i[n:n+1] ][::-1]


if __name__ == '__main__':
    import timeit
    print(timeit.timeit("edges()", setup="from __main__ import edges", number = 100))

最佳时间是0.0006266489999688929

© www.soinside.com 2019 - 2024. All rights reserved.