多元线性回归-仅删除缺少的值,而不删除整个行-Python

问题描述 投票:1回答:1

我有一个因变量和许多不同的自变量。在自变量的一列中,我有许多零值,或者我们假设“缺失值”。现在,当我执行多元回归时,模型将受到零的影响,如果缺少值,模型将删除整行。我想要的是,如果模型变量是零值或缺失值,则模型不会考虑该变量,但仍保留其他自变量来预测模型。

这里是多元线性回归的代码:

model= smf.ols('conso_gaz_m2~  Number_rooms+veranda+surface', data=dataset_clean)

假设在Number_rooms中缺少一个值,那么conso_gaz_m2将由其他自变量(游廊,表面等)预测。

是否存在执行该功能的功能?

谢谢。

python statistics regression statsmodels
1个回答
1
投票

如果您不希望模型考虑缺少值或等于零的变量,只需从数据集中删除这些模型。

import pandas as pd

# Drop variables with missing values
dataset_clean.dropna(axis = 1, inplace = True)

# Drop variables with values of zero
dataset_clean = dataset_clean.loc[:, ~(dataset_clean == 0).any()]

然后将新的数据框插入模型。

© www.soinside.com 2019 - 2024. All rights reserved.