我正在寻找最快的方法来获取二维数组每行和每列的非零索引列表。以下是一段工作代码:
preds = [matrix[:,v].nonzero()[0] for v in range(matrix.shape[1])]
descs = [matrix[v].nonzero()[0] for v in range(matrix.shape[0])]
示例输入:
matrix = np.array([[0,0,0,0],[1,0,0,0],[1,1,0,0],[1,1,1,0]])
示例输出
preds = [array([1, 2, 3]), array([2, 3]), array([3]), array([], dtype=int64)]
descs = [array([], dtype=int64), array([0]), array([0, 1]), array([0, 1, 2])]
(这些列表称为 preds 和 descs,因为当矩阵被解释为邻接矩阵时,它们指的是 DAG 中的前辈和后裔,但这对问题来说不是必需的。)
时序示例: 出于计时目的,以下矩阵是一个很好的代表:
test_matrix = np.zeros(shape=(4096,4096),dtype=np.float32)
for k in range(16):
test_matrix[256*(k+1):256*(k+2),256*k:256*(k+1)]=1
背景: 在我的代码中,对于一个 4000x4000 的矩阵,这两行代码占用了 75% 的时间,而随后的拓扑排序和 DP 算法只占用了四分之一的剩余时间。矩阵中大约 5% 的值是非零值,因此稀疏矩阵解决方案可能适用。
谢谢。
(关于此处也发布的建议:https://scicomp.stackexchange.com/questions/35242/fast-nonzero-indices-per-row-column-for-sparse-2d-numpy-array 那里也有答案,我将在评论中提供时间安排。 此链接包含一个可接受的答案,速度是原来的两倍。)
如果你有足够的动力,Numba 可以做出惊人的事情。 这是您需要的逻辑的快速实现。 简而言之,它计算了
np.nonzero()
的等价物,但它包含了稍后将索引分派为您需要的格式的信息。
该信息的灵感来自sparse.csr.indptr
和sparse.csc.indptr
.
import numpy as np
import numba as nb
@nb.jit
def cumsum(arr):
result = np.empty_like(arr)
cumsum = result[0] = arr[0]
for i in range(1, len(arr)):
cumsum += arr[i]
result[i] = cumsum
return result
@nb.jit
def count_nonzero(arr):
arr = arr.ravel()
n = 0
for x in arr:
if x != 0:
n += 1
return n
@nb.jit
def row_col_nonzero_nb(arr):
n, m = arr.shape
max_k = count_nonzero(arr)
indices = np.empty((2, max_k), dtype=np.uint32)
i_offset = np.zeros(n + 1, dtype=np.uint32)
j_offset = np.zeros(m + 1, dtype=np.uint32)
n, m = arr.shape
k = 0
for i in range(n):
for j in range(m):
if arr[i, j] != 0:
indices[:, k] = i, j
i_offset[i + 1] += 1
j_offset[j + 1] += 1
k += 1
return indices, cumsum(i_offset), cumsum(j_offset)
def row_col_idx_nonzero_nb(arr):
(ii, jj), jj_split, ii_split = row_col_nonzero_nb(arr)
ii_ = np.argsort(jj)
ii = ii[ii_]
return np.split(ii, ii_split[1:-1]), np.split(jj, jj_split[1:-1])
根据
@hpaulj 的回答(
row_col_idx_sep()
) 和来自 scicomp.stackexchange.com 的 @knl 回答(
row_col_idx_sparse_lil()
),与您的方法(下面的row_col_idx_sparse_coo()
)和其他一些方法相比:
def row_col_idx_sep(arr):
return (
[arr[:, j].nonzero()[0] for j in range(arr.shape[1])],
[arr[i, :].nonzero()[0] for i in range(arr.shape[0])],)
def row_col_idx_zip(arr):
n, m = arr.shape
ii = [[] for _ in range(n)]
jj = [[] for _ in range(m)]
x, y = np.nonzero(arr)
for i, j in zip(x, y):
ii[i].append(j)
jj[j].append(i)
return jj, ii
import scipy as sp
import scipy.sparse
def row_col_idx_sparse_coo(arr):
coo_mat = sp.sparse.coo_matrix(arr)
csr_mat = coo_mat.tocsr()
csc_mat = coo_mat.tocsc()
return (
np.split(csc_mat.indices, csc_mat.indptr)[1:-1],
np.split(csr_mat.indices, csr_mat.indptr)[1:-1],)
def row_col_idx_sparse_lil(arr):
lil_mat = sp.sparse.lil_matrix(arr)
return lil_mat.T.rows, lil_mat.rows
对于使用生成的输入:
def gen_input(n, density=0.1, dtype=np.float32):
arr = np.zeros(shape=(n, n), dtype=dtype)
indices = tuple(np.random.randint(0, n, (2, int(n * n * density))).tolist())
arr[indices] = 1.0
return arr
一个人会得到(你的
test_matrix
有大约0.06的非零密度):
m = gen_input(4096, density=0.06)
%timeit row_col_idx_sep(m)
# 1 loop, best of 3: 767 ms per loop
%timeit row_col_idx_zip(m)
# 1 loop, best of 3: 660 ms per loop
%timeit row_col_idx_sparse_coo(m)
# 1 loop, best of 3: 205 ms per loop
%timeit row_col_idx_sparse_lil(m)
# 1 loop, best of 3: 498 ms per loop
%timeit row_col_idx_nonzero_nb(m)
# 10 loops, best of 3: 130 ms per loop
表明这接近最快的基于
scipy.sparse
的方法的两倍。
In [182]: arr = np.array([[0,0,0,0],[1,0,0,0],[1,1,0,0],[1,1,1,0]])
数据存在于整个数组中
nonzero
,只是没有分解成每行/列数组:
In [183]: np.nonzero(arr)
Out[183]: (array([1, 2, 2, 3, 3, 3]), array([0, 0, 1, 0, 1, 2]))
In [184]: np.argwhere(arr)
Out[184]:
array([[1, 0],
[2, 0],
[2, 1],
[3, 0],
[3, 1],
[3, 2]])
有可能将
array([1, 2, 2, 3, 3, 3])
分解成子列表,[1,2,3],[2,3],[3],[]
基于其他数组。但这可能需要一些时间来解决这个问题的逻辑,并且不能保证它会比你的行/列迭代更快。
逻辑运算可以将布尔数组简化为列或行,给出非零出现的行或列,但同样不参差不齐:
In [185]: arr!=0
Out[185]:
array([[False, False, False, False],
[ True, False, False, False],
[ True, True, False, False],
[ True, True, True, False]])
In [186]: (arr!=0).any(axis=0)
Out[186]: array([ True, True, True, False])
In [187]: np.nonzero((arr!=0).any(axis=0))
Out[187]: (array([0, 1, 2]),)
In [188]: np.nonzero((arr!=0).any(axis=1))
Out[188]: (array([1, 2, 3]),)
In [189]: arr
Out[189]:
array([[0, 0, 0, 0],
[1, 0, 0, 0],
[1, 1, 0, 0],
[1, 1, 1, 0]])
scipy.sparse
lil
格式确实生成了你想要的数据:
In [190]: sparse
Out[190]: <module 'scipy.sparse' from '/usr/local/lib/python3.6/dist-packages/scipy/sparse/__init__.py'>
In [191]: M = sparse.lil_matrix(arr)
In [192]: M
Out[192]:
<4x4 sparse matrix of type '<class 'numpy.longlong'>'
with 6 stored elements in List of Lists format>
In [193]: M.rows
Out[193]: array([list([]), list([0]), list([0, 1]), list([0, 1, 2])], dtype=object)
In [194]: M.T
Out[194]:
<4x4 sparse matrix of type '<class 'numpy.longlong'>'
with 6 stored elements in List of Lists format>
In [195]: M.T.rows
Out[195]: array([list([1, 2, 3]), list([2, 3]), list([3]), list([])], dtype=object)
但是时间可能并不比您的行或列迭代更好。
也可以使用
np.bincount()
,例如
# Suppose X is a sparse matrix
In [56]: X.shape
Out[56]: (5830, 93761)
# Non-zero elements per row
In [57]: np.bincount(X.nonzero()[0])
Out[57]: array([316, 305, 98, ..., 284, 915, 721])
# Non-zero elements per column
In [58]: np.bincount(X.nonzero()[1])
Out[58]: array([14, 10, 1, ..., 1, 1, 1])
# Its also reasonably quick
In [59]: %timeit np.bincount(X.nonzero()[0])
24.1 ms ± 393 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)
需要注意的一件事是矩阵中的行/列全为零:
In [60]: A = np.array([[0, 1, 0], [0, 0, 0]])
In [61]: np.bincount(A.nonzero()[0])
Out[61]: array([1]) # <-- Second row is all zeros, so its omitted here
In [62]: B = np.array([[0, 0, 0], [0, 0, 1]])
In [63]: np.bincount(B.nonzero()[0])
Out[63]: array([0, 1])