我有一个因变量和许多不同的自变量。在自变量的一列中,我有许多零值,或者我们假设“缺失值”。现在,当我执行多元回归时,模型将受到零的影响,如果缺少值,模型将删除整行。我想要的是,如果模型变量是零值或缺失值,则模型不会考虑该变量,但仍保留其他自变量来预测模型。
这里是多元线性回归的代码:
model= smf.ols('conso_gaz_m2~ Number_rooms+veranda+surface', data=dataset_clean)
假设在Number_rooms中缺少一个值,那么conso_gaz_m2将由其他自变量(游廊,表面等)预测。
是否存在执行该功能的功能?
谢谢。
如果您不希望模型考虑缺少值或等于零的变量,只需从数据集中删除这些模型。
import pandas as pd
# Drop variables with missing values
dataset_clean.dropna(axis = 1, inplace = True)
# Drop variables with values of zero
dataset_clean = dataset_clean.loc[:, ~(dataset_clean == 0).any()]
然后将新的数据框插入模型。