我遇到了这个SQL问题,并想知道我是否可以在python pandas中解决它。
SQL问题:表格点保存平面中x轴上某些点的x坐标,它们都是整数。
编写查询以查找这些点中两点之间的最短距离。
| x |
|-----|
| -1 |
| 0 |
| 2 |
我发起了如下的pandas数据帧。
import pandas as pd
point = pd.DataFrame(np.array([-1,0,2]), columns=['x'])
我试图这样做
p1 = point
p2 = point.copy()
p1.merge(p2, on='x', condition = ('!='))
但我知道没有这样的条件。
任何人都可以在熊猫中解决这个问题吗?
注意:我的问题与join two dt when columns are not equal不同,所以它不是重复的。我的问题是将所有值附加到原始集合中的每个值。链接中的问题是找出差异。
point = [-1, 0, 1]
ix = pd.MultiIndex.from_product([point, point], names=['a', 'b'])
df = pd.DataFrame(index=ix).reset_index()
df = df[df.a != df.b]
将(rather) efficiently get you a dataframe与两个坐标的唯一组合,就像SQL中的外连接一样:
a b
1 -1 0
2 -1 1
3 0 -1
5 0 1
6 1 -1
7 1 0
在那之后,你可以得到距离
>>> (df.a - df.b).abs().min()
1
这是交叉连接后的过滤器
p1.assign(key=1).merge(p2.assign(key=1),on='key').loc[lambda x : x['x_x']!=x['x_y']]
Out[29]:
x_x key x_y
1 -1 1 0
2 -1 1 2
3 0 1 -1
5 0 1 2
6 2 1 -1
7 2 1 0