我有一个包含z值的numpy 1D数组,我想计算所有条目组合之间的差值,输出为一个平方矩阵。
我知道如何使用 cdist 计算所有组合点之间的距离,但这并没有给我符号。
例如我的Z向量是[1,5,8]
import numpy as np
from scipy.spatial.distance import cdist
z=np.array([1, 5, 8])
z2=np.column_stack((z,np.zeros(3)))
cdist(z2,z2)
给我。
array([[0., 4., 7.],
[4., 0., 3.],
[7., 3., 0.]])
但我希望有符号给我。
array([[0., 4., 7.],
[-4., 0., 3.],
[-7., -3., 0.]])
我想通过使用np.tril_indices来翻转下三角的符号来做手脚,但这是行不通的,因为我需要对我的操作以一致的方式进行差分(即如果我对两个或多个向量执行这个操作,那么这些向量对总是以相同的顺序进行比较),而通过翻转符号,我将总是在右上角有正差,在左下角有负差。
In [29]: z = np.array([1, 5, 8])
In [30]: -np.subtract.outer(z, z)
Out[30]:
array([[ 0, 4, 7],
[-4, 0, 3],
[-7, -3, 0]])
(如果你不关心符号约定,请去掉减号。)
使用numpy数组广播的简单一行解决方案。
import numpy as np
z = np.array([1, 5, 8])
# Simple one line solution
z - z.reshape(-1,1)
輸出:
array([[ 0, 4, 7],
[-4, 0, 3],
[-7, -3, 0]])
我发现我可以用双迭代器得到我想要的答案,尽管我不确定它对非常大的数组是否最有效。
np.array([j-i for i in z for j in z]).reshape(len(z),len(z))
输出。
array([[ 0, 4, 7],
[-4, 0, 3],
[-7, -3, 0]])
EDIT:所以确实另外两种解决方案的速度要快50倍左右。
python3 -m timeit -s "import numpy as np" -s "z=np.random.uniform(size=5000)" "z-z.reshape(-1,1)"
2 loops, best of 5: 119 msec per loop
python3 -m timeit -s "import numpy as np" -s "z=np.random.uniform(size=5000)" "np.subtract.outer(z, z)"
2 loops, best of 5: 118 msec per loop
python3 -m timeit -s "import numpy as np" -s "z=np.random.uniform(size=5000)" "np.array([j-i for i in z for j in z]).reshape(len(z),len(z))"
1 loop, best of 5: 5.18 sec per loop