为什么我使用statsmodels进行OLS和使用scikit进行PooledOLS时会得到相同的结果?

问题描述 投票:1回答:1

我目前正在使用python做一个机器学习项目(这里是初学者,从头开始学习一切。)>

只想知道使用我拥有的相同面板数据集,statsmodels的OLS和scikit的PooledOlS有什么区别。我都尝试过,他们给了我相同的结果。这是否意味着他们本质上是在做相同的事情,但包装不同?我应该得到相同的结果吗?还是我做错了什么?

我的数据集如下所示:

                  excessreturnlag1m      ROA  ...  momentum6m  momentum12m
bank  date                                    ...                         
bankA 2019-06-30         -14.564600   0.9795  ...        0.14        -0.24
      2019-05-31           7.522300   0.9795  ...       -0.69        -1.97
      2019-04-30          -2.020400   0.9795  ...        1.36        -1.70
bankB 2019-06-30          -5.969600   0.9915  ...       -0.39        -1.77
      2019-05-31           0.220200   0.9915  ...       -0.24        -2.00
      2019-04-30          -1.900000   0.9915  ...       -0.06        -1.42
bankC 2019-06-30           2.721700   0.9763  ...       -0.38        -1.13
      2019-05-31          -8.418900   0.9763  ...       -1.28        -1.19
      2019-04-30          -1.001100   0.9763  ...       -3.06        -1.16

我目前在我的数据框中有一个MultiIndex(银行和日期)。我应该使用它进行面板回归吗?

编辑:好的,据我了解,PooledOLS是多元线性回归的“特殊”情况,因此其结果与statsmodels的OLS相同吗?如果我错了,请纠正我!

我目前正在使用python做一个机器学习项目(这里是初学者,从头开始学习一切)。只想知道statsmodels的OLS和scikit的PooledOls之间有什么区别...

python dataframe regression panel statsmodels
1个回答
0
投票

OLS普通最小二乘法

© www.soinside.com 2019 - 2024. All rights reserved.