几何形状之间的大地距离Python

问题描述 投票:3回答:1

具有带有称为几何的列且具有以下几何形状的dfA:

d = {'id': [1, 2], 'geometry': ['POINT (-70.66000 -33.45000)', 'POINT (-74.08000 4.60000)']}
dfA = pd.DataFrame(data=d)
dfA

|   | id | geometry              |
|---|----|-----------------------|
| 0 | 1  | POINT (-70.66 -33.45) |
| 1 | 2  | POINT (-74.08 4.6)    |

我想用dfB的几何列的每个几何形状来计算最小测地线距离:

d = {'id': [1, 2, 3], 'geometry': ['LINESTRING (-58.66000 -34.58000, -59.66000 -35.58000)', 'LINESTRING (-47.91000 -15.78000, -48.91000 -16.78000)', 'POINT (-66.86000 10.48000)']}
dfB = pd.DataFrame(data=d)
dfB

|   | id | geometry                                  |
|---|----|-------------------------------------------|
| 0 | 1  | LINESTRING (-58.66 -34.58, -59.66 -35.58) |
| 1 | 2  | LINESTRING (-47.91 -15.78, -48.91 -16.78) |
| 2 | 3  | POINT (-66.86 10.48)                      |

我已尝试按照以下步骤使用Python shapely和geopandas库进行此计算:

from shapely import wkt
import geopandas as gpd

dfA['geometry'] = dfA['geometry'].apply(wkt.loads)
dfA = gpd.GeoDataFrame(dfA, geometry='geometry')
dfB['geometry']= dfB['geometry'].apply(wkt.loads)
for i, value in dfB.iterrows():
    e = dfB.iloc[i]['id']
    dfA[str(e)] = dfA['geometry'].distance(dfB.iloc[i]['geometry'])
dfA

|   | id | geometry              | 1           | 2           | 3           |
|---|----|-----------------------|-------------|-------------|-------------|
| 0 | 1  | POINT (-70.66 -33.45) | 11,20432506 | 27,40349248 | 44,09404608 |
| 1 | 2  | POINT (-74.08 4.6)    | 42,10521108 | 33,0247377  | 9,311433832 |

不幸的是,形状距离函数计算的是欧几里得距离而不是测地线距离。

另一种遵循的策略是使用一个函数来计算从点A到线B [B1,B2,B3,...]上所有点的测地距离,并保持最小距离。也就是说:dist_A-B = min(geodist(A,B1),geodist(A,B2),geodist(A,B3),....)]

此解决方案有效,但是在计算上非常昂贵,因为我们正在谈论的是从数千个点到数千行的计算。任何其他更优化的方法来执行此计算将有很大帮助。

python distance geopandas shapely geodesic-sphere
1个回答
2
投票

如果可以通过计算到一组点的测地距离来减少问题,则vantage point tree将为您提供有效的解决方案。参见我对类似问题的回答here;这包括python中的解决方案。

© www.soinside.com 2019 - 2024. All rights reserved.