这里是代码:
from statsmodels.formula.api import ols import io import requests url = "https://raw.githubusercontent.com/RInterested/datasets/gh-pages/mtcars.csv" contents = requests.get(url).content mtcars = pd.read_csv(io.StringIO(contents.decode('utf-8'))) print(mtcars.describe()) reg = ols('mpg ~ C(cyl) + wt', data=mtcars).fit() print(reg.summary())
这似乎返回该模型的截距,并且语法与我喜欢的R非常相似。
reg.predict
中有一个reg.get_predict
和一个print(dir(reg))
,但是它们都不返回数据集中每个示例(案例或主题)的预测值。似乎可能正在等待“样本外”数组吐出这些预测值。
我想获得实际数据集中示例的预测mpg
,将其绘制为与实际数据云不同颜色的点,并叠加在回归线上:
这里是代码:从statsmodels.formula.api import ols import io导入请求url =“ https://raw.githubusercontent.com/RInterested/datasets/gh-pages/mtcars.csv”内容= requests.get( url)....
样本中预测可作为结果实例上的reg.fittedvalues
属性使用,而在调用不带参数的预测时,reg.predict()
。