Pandas加入table1.x!= table2.x

问题描述 投票:0回答:2

我遇到了这个SQL问题,并想知道我是否可以在python pandas中解决它。

SQL问题:表格点保存平面中x轴上某些点的x坐标,它们都是整数。

编写查询以查找这些点中两点之间的最短距离。

| x   |
|-----|
| -1  |
| 0   |
| 2   |

我发起了如下的pandas数据帧。

import pandas as pd
point = pd.DataFrame(np.array([-1,0,2]), columns=['x'])

我试图这样做

p1 = point
p2 = point.copy()
p1.merge(p2, on='x', condition = ('!='))

但我知道没有这样的条件。

任何人都可以在熊猫中解决这个问题吗?

注意:我的问题与join two dt when columns are not equal不同,所以它不是重复的。我的问题是将所有值附加到原始集合中的每个值。链接中的问题是找出差异。

python pandas
2个回答
3
投票
point = [-1, 0, 1]
ix = pd.MultiIndex.from_product([point, point], names=['a', 'b'])
df = pd.DataFrame(index=ix).reset_index()
df = df[df.a != df.b]

(rather) efficiently get you a dataframe与两个坐标的唯一组合,就像SQL中的外连接一样:

   a  b
1 -1  0
2 -1  1
3  0 -1
5  0  1
6  1 -1
7  1  0

在那之后,你可以得到距离

>>> (df.a - df.b).abs().min()
1

1
投票

这是交叉连接后的过滤器

p1.assign(key=1).merge(p2.assign(key=1),on='key').loc[lambda x : x['x_x']!=x['x_y']]
Out[29]: 
   x_x  key  x_y
1   -1    1    0
2   -1    1    2
3    0    1   -1
5    0    1    2
6    2    1   -1
7    2    1    0
© www.soinside.com 2019 - 2024. All rights reserved.