我有两个数据集,如下所示。
数据1:latlon log
#log_id, lat, lon
0001 , 31.30272 , 103.66426
0002 , 31.23483 , 103.12323
:
数据2:六边形单元格网格信息
#grid_id, point1_lat , point1_lon , ・・・ , point6_lat , point6_lon
000001, 31.30272 , 103.66426 , 31.30272 , 103.66426 , ・・・ , 31.30242 , 103.65676
:
如何提取数据2中的网格ID与数据1中的日志ID对应,如下图。
log_id , grid_id
0001 , 000324
0002 , 002341
:
我使用的是PostgreSQL或python
我想你应该要使用外部合并来合并两个或更多的数据集在一个数据集中。
比如说,你可以从合并的数据中选择两个ID。
merged_data = pd.merge(data1, data2, how='outer)
你就可以从合并的数据中选择两个ID了
selected_columns = merged_data[merged_data['log_id'] & merged_data['grid_id']]
print(selected_columns)