我试图用Python复制一篇论文,其代码是用Stata编写的,用于我的课程项目。我很难复制他们do-file中的collapse命令的结果。do-file中对应的行是
collapse lexptot, by(clwpop right)
趁我
df.groupby(['cwpop', 'right'])['lexptot'].agg(['mean'])
该 lexptot
变量是变量的对数'。exptot
',我之前用 np.log(dfs['exptot])
.
有谁知道这里出了什么问题吗?我计算的平均值通常比Stata计算的平均值高1.5左右。
一旦你用更多相关的细节更新问题,也许我可以回答更多。但这是我认为可能对你有帮助的地方!
df.groupby(['cwpop', 'right']).mean()['lexptot']