我有一个数据框,其中包含有关几家公司董事的教育背景的分类数据。目前,每个公司(由其股票代码记录)有多个条目,每个董事一个,df看起来像这样:
Ticker Education
ABC 1
ABC 1
ABC 5
ABC 7
ABC 5
DEF 3
DEF 4
DEF 4
DEF 4
DEF 6
我想使用Blau的索引公式(与Gini-Simpson索引相同)来创建一个新的数据框,每个公司只有一个条目,如下所示:
Ticker Education Diversity
ABC 0.64
DEF 0.56
使用的公式是(1 - Σpi2)其中pi是每个教育类别中董事的比例;例如对于公司ABC,p1 = 2/5。
任何人都可以帮我在Python(3.7)中实现这一点吗?任何帮助将不胜感激!
您可以尝试实现自己的qazxsw poi然后使用qazxsw poi。最后,qazxsw poi回到def
格式:
groupby.apply