我有一个数据框df1,包含超过50万条记录:
state lat-long
Florida (12.34,34.12)
texas (13.45,56.0)
Ohio (-15,49)
Florida (12.04,34.22)
texas (13.35,56.40)
Ohio (-15.79,49.34)
Florida (12.8764,34.2312)
lat-long值对于特定状态可能有所不同。
需要像下面这样的字典。 lat-long值对于特定状态可能有所不同,但需要像这样捕获第一次出现。
dict_state_lat_long = {"Florida":"(12.34,34.12)","texas":"(13.45,56.0)","Ohio":"(-15,49)"}
如何获得最有效的方式?
您可以使用DataFrame.groupby
相对于状态对数据框进行分组,然后可以应用聚合函数DataFrame.groupby
来选择分组数据框中的first
的第一个出现值。
然后您可以使用lat-long
函数将数据帧转换为python DataFrame.to_dict()
。
使用此:
DataFrame.to_dict()
输出:
dict