在Python中引导多个回归参数

问题描述 投票:1回答:1

我正在尝试使用bootstraping来估计Python中的多个回归系数,我无法弄清楚如何实现它。

我使用statsmodels.ols(formula ='Y~A * B * C,...)来运行单个模型。如何实现一个引导程序,它将返回这个普通最小二乘模型返回的所有参数的估计值和置信区间?

我看到statsmodels中可能有一个bootstrap方法,但是我无法弄清楚如何导入它以及它是否具有我想要的功能。在scikits中还有一个(或几个),但同样,我无法弄清楚如何使用这些来估计许多返回的回归参数。

谢谢你的帮助。我完全被难倒 - 而且相当新的Python。

python statistics linear-regression bootstrapping statsmodels
1个回答
1
投票

您可以使用resample包,可以通过pip下载。这是Github页面:https://github.com/dsaxton/resample

doc文件夹中有一个笔记本,其中包含一个正是这类问题的例子(这里我们使用的是sklearn,但它也可以适用于statsmodels)。基本上,您将建模过程定义为完整数据集(包括预测变量和响应变量)的函数,它以您喜欢的任何格式返回模型参数(这里我们返回带有系数和截距的字典)然后重新计算使用来自bootstrap模块的resample.bootstrap对bootstrap样本的函数(df是包含预测变量的pandas DataFrame和带有响应变量的y):

Series
© www.soinside.com 2019 - 2024. All rights reserved.