如何使用Statsmodels.api获得回归拦截

Question

我正在尝试使用python库计算回归输出，但我无法使用;当我使用库时获取拦截值：

import statsmodels.api as sm

它打印除截距之外的所有回归分析。

但是当我使用时：

from pandas.stats.api import ols

我的熊猫代码：

Regression = ols(y= Sorted_Data3['net_realization_rate'],x = Sorted_Data3[['Cohort_2','Cohort_3']])
print Regression

我得到了拦截，并警告说这个库将来会被弃用，所以我试图使用Statsmodels。

我在使用pandas.stats.api时得到的警告：

警告（来自警告模块）：文件“C：\ Python27 \ lib \ idlelib \ run.py”，第325行exec代码在self.locals中FutureWarning：pandas.stats.ols模块已弃用，将在以后的版本中删除。我们引用像statsmodels这样的外部包，在这里看一些例子：http://statsmodels.sourceforge.net/stable/regression.html

我的Statsmodels代码：

import pandas as pd
import numpy as np
from pandas.stats.api import ols
import statsmodels.api as sm

Data1 = pd.read_csv('C:\Shank\Regression.csv')  #Importing CSV
print Data1

运行一些清洁代码

sm_model = sm.OLS(Sorted_Data3['net_realization_rate'],Sorted_Data3[['Cohort_2','Cohort_3']])
results = sm_model.fit()
print '\n'
print results.summary()

我甚至尝试过statsmodels.formula.api：as：

sm_model = sm.OLS(formula ="net_realization_rate ~ Cohort_2 + Cohort_3", data = Sorted_Data3)
results = sm_model.fit()
print '\n'
print result.params
print '\n'
print results.summary()

但我得到错误：

TypeError：init（）至少需要2个参数（给定1个）

最终输出：第一个来自熊猫第二个是来自统计数据......我希望拦截值为来自统计数据的大熊猫：qazxsw poi

Answer 1

因此，有一个statsmodels方法，您需要使用它来显式添加拦截值。恕我直言，这比默认添加拦截的R替代方案更好。

在您的情况下，您需要这样做：

add_constant

请注意，您可以在数组之前或之后添加常量，方法是将import statsmodels.api as sm endog = Sorted_Data3['net_realization_rate'] exog = sm.add_constant(Sorted_Data3[['Cohort_2','Cohort_3']]) # Fit and summarize OLS model mod = sm.OLS(endog, exog) results = mod.fit() print results.summary()（默认值）或True传递给False中的prepend kwag

或者，不推荐，但您可以使用Numpy显式添加常量列，如下所示：

sm.add_constant

Answer 2

你也可以这样做：

exog = np.concatenate((np.repeat(1, len(Sorted_Data3))[:, None], 
                       Sorted_Data3[['Cohort_2','Cohort_3']].values),
                       axis = 1)

在这里，您明确地为拦截创建一列。

然后你可以像这样使用sm.OLS方法：

df['intercept'] = 1

如何使用Statsmodels.api获得回归拦截

问题描述投票：7回答：2

2个回答

最新问题

如何使用Statsmodels.api获得回归拦截

问题描述 投票：7回答：2

2个回答

最新问题

问题描述投票：7回答：2