pandas数据框架的groupby给出了错误的结果。

Question

我试图用Python复制一篇论文，其代码是用Stata编写的，用于我的课程项目。我很难复制他们do-file中的collapse命令的结果。do-file中对应的行是

collapse lexptot, by(clwpop right)

趁我

df.groupby(['cwpop', 'right'])['lexptot'].agg(['mean'])

该 lexptot 变量是变量的对数'。exptot'，我之前用 np.log(dfs['exptot]).

有谁知道这里出了什么问题吗？我计算的平均值通常比Stata计算的平均值高1.5左右。

Answer 1

一旦你用更多相关的细节更新问题，也许我可以回答更多。但这是我认为可能对你有帮助的地方!

df.groupby(['cwpop', 'right']).mean()['lexptot']