从具有重复列值的数据帧中创建字典

问题描述 投票:0回答:1

我有一个数据框df1,包含超过50万条记录:

state          lat-long
Florida        (12.34,34.12)
texas          (13.45,56.0)
Ohio           (-15,49) 
Florida        (12.04,34.22)
texas          (13.35,56.40)
Ohio           (-15.79,49.34) 
Florida        (12.8764,34.2312)

lat-long值对于特定状态可能有所不同。

需要像下面这样的字典。 lat-long值对于特定状态可能有所不同,但需要像这样捕获第一次出现。

dict_state_lat_long = {"Florida":"(12.34,34.12)","texas":"(13.45,56.0)","Ohio":"(-15,49)"}

如何获得最有效的方式?

python pandas
1个回答
0
投票

您可以使用DataFrame.groupby相对于状态对数据框进行分组,然后可以应用聚合函数DataFrame.groupby来选择分组数据框中的first的第一个出现值。

然后您可以使用lat-long函数将数据帧转换为python DataFrame.to_dict()

使用此:

DataFrame.to_dict()

输出

dict
© www.soinside.com 2019 - 2024. All rights reserved.