计算向量中所有组合的差值

问题描述 投票:0回答:3

我有一个包含z值的numpy 1D数组,我想计算所有条目组合之间的差值,输出为一个平方矩阵。

我知道如何使用 cdist 计算所有组合点之间的距离,但这并没有给我符号。

例如我的Z向量是[1,5,8]

import numpy as np
from scipy.spatial.distance import cdist

z=np.array([1, 5, 8])
z2=np.column_stack((z,np.zeros(3)))
cdist(z2,z2)

给我。

array([[0., 4., 7.],
       [4., 0., 3.],
       [7., 3., 0.]])

但我希望有符号给我。

array([[0., 4., 7.],
       [-4., 0., 3.],
       [-7., -3., 0.]])

我想通过使用np.tril_indices来翻转下三角的符号来做手脚,但这是行不通的,因为我需要对我的操作以一致的方式进行差分(即如果我对两个或多个向量执行这个操作,那么这些向量对总是以相同的顺序进行比较),而通过翻转符号,我将总是在右上角有正差,在左下角有负差。

python algorithm scipy distance numpy-broadcasting
3个回答
1
投票
In [29]: z = np.array([1, 5, 8])                                                                                                                                                                     

In [30]: -np.subtract.outer(z, z)                                                                                                                                                                    
Out[30]: 
array([[ 0,  4,  7],
       [-4,  0,  3],
       [-7, -3,  0]])

(如果你不关心符号约定,请去掉减号。)


2
投票

使用numpy数组广播的简单一行解决方案。

import numpy as np

z = np.array([1, 5, 8])
# Simple one line solution
z - z.reshape(-1,1)

輸出:

array([[ 0,  4,  7],
       [-4,  0,  3],
       [-7, -3,  0]])

0
投票

我发现我可以用双迭代器得到我想要的答案,尽管我不确定它对非常大的数组是否最有效。

np.array([j-i for i in z for j in z]).reshape(len(z),len(z))

输出。

array([[ 0,  4,  7],
   [-4,  0,  3],
   [-7, -3,  0]])

EDIT:所以确实另外两种解决方案的速度要快50倍左右。

python3 -m timeit -s "import numpy as np" -s "z=np.random.uniform(size=5000)" "z-z.reshape(-1,1)"
2 loops, best of 5: 119 msec per loop

python3 -m timeit -s "import numpy as np" -s "z=np.random.uniform(size=5000)" "np.subtract.outer(z, z)"
2 loops, best of 5: 118 msec per loop

python3 -m timeit -s "import numpy as np" -s "z=np.random.uniform(size=5000)" "np.array([j-i for i in z for j in z]).reshape(len(z),len(z))"
1 loop, best of 5: 5.18 sec per loop
© www.soinside.com 2019 - 2024. All rights reserved.