为什么XGBRegressor预测功能不匹配警告？

Question

我想使用XGBRegressor预测一些数据。因此，我加载了训练数据和测试数据。

iowa_file_path = '../input/train.csv'
test_data_path = '../input/test.csv'

data = pd.read_csv(iowa_file_path)
test_data = pd.read_csv(test_data_path)

数据内容

test_data的内容

然后我进行一些数据清理

data.dropna(axis=0, subset=['SalePrice'], inplace=True)
y = data.SalePrice
X = data.drop(['SalePrice'], axis=1).select_dtypes(exclude=['object'])

train_X, val_X, train_y, val_y = train_test_split(X.values, y.values, test_size =0.25)
my_imputer = SimpleImputer()
train_X = my_imputer.fit_transform(train_X)
val_X = my_imputer.transform(val_X)

my_model = XGBRegressor(n_estimators=100, learning_rate=0.1)
my_model.fit(train_X, train_y, early_stopping_rounds=None, 
    eval_set=[(val_X, val_y)], verbose=False)

test_data_process = test_data.select_dtypes(exclude=['object'])
predictions = my_model.predict(test_data_process)

但是运行predict函数时收到以下错误消息：

ValueError Traceback（最近一次通话）在（）中1个test_data_process = test_data.select_dtypes（排除= ['对象']）----> 2个预测= my_model.predict（test_data_process）
/ opt / conda / lib / python3.6 / site-packages / xgboost-0.80-py3.6.egg / xgboost / sklearn.py indict（self，data，output_margin，ntree_limit，validate_features）395 output_margin = output_margin，396 ntree_limit = ntree_limit，-> 397 validate_features = validate_features）398399 def apply（self，X，ntree_limit = 0）：
/ opt / conda / lib / python3.6 / site-packages / xgboost-0.80-py3.6.egg / xgboost / core.py在预测中，validate_features）12061207如果validate_features：-> 1208 self._validate_features（数据）12091210长度= c_bst_ulong（）
/ opt / conda / lib / python3.6 / site-packages / xgboost-0.80-py3.6.egg / xgboost / core.py in _validate_features（自身，数据）15081509 Value-> 1510 data.feature_names））15111512 def get_split_value_histogram（self，feature，fmap =''，bins = None，as_pandas = True）：
ValueError：feature_names不匹配：['f0'，'f1'，'f2'，'f3'，'f4'，'f5'，'f6'，'f7'，'f8'，'f9'，'f10 '，'f11'，'f12'，'f13'，'f14'，'f15'，'f16'，'f17'，'f18'，'f19'，'f20'，'f21'，'f22'， 'f23'，'f24'，'f25'，'f26'，'f27'，'f28'，'f29'，'f30'，'f31'，'f32'，'f33'，'f34'，'f35 '，'f36'] ['Id'，'MSSubClass'，'LotFrontage'，'LotArea'，'OverallQual'，'OverallCond'，'YearBuilt'，'YearRemodAdd'，'MasVnrArea'，'BsmtFinSF1'，'BsmtFinSF2' ，'BsmtUnfSF'，'TotalBsmtSF'，'1stFlrSF'，'2ndFlrSF'，'LowQualFinSF'，'GrLivArea'，'BsmtFullBath'，'BsmtHalfBath'，'FullBath'，'HalfBath'，'BedroomAbvGr' TotRmsAbvGrd”，“壁炉”，“ GarageYrBlt”，“ GarageCars”，“ GarageArea”，“ WoodDeckSF”，“ OpenPorchSF”，“ EnclosedPorch”，“ 3SsnPorch”，“ ScreenPorch”，“ PoolArea”，“ MiscVal”，“ Mo ，'YrSold']预期的f9，f6，f14，f27，f18，f7，f8，f23，f17，f22，f35，f0，f28，f29，f20，f31，f36，f25，f11，f21，f12，f24，f34，f10，f5 ，f32，f15，f26，f30，f1，f2，f16，f19，f3，f4，f33，f13训练数据没有以下字段：BsmtUnfSF，1stFlrSF，LowQualFinSF，MSSubClass，WoodDeckSF，GrLivArea，MiscVal，YearBuilt，BsmtFinSF1，Fireplaces，MoSold，BsmtHalfBath，GarageYrBlt，FullBath，PoolArea，YrSoldblow，FloatAqual，YrSold，，EnclosedPorch，ScreenPorch，GarageArea，BsmtFullBath，MasVnrArea，TotRmsAbvGrd，TotalCond，BedroomAbvGr，GarageCars，OpenPorchSF，YearRemodAdd，TotalBsmtSF，BsmtFinSF2，LotFrontage，3SsnPorch，
[它抱怨功能不匹配，并且我在训练数据中没有这些字段。但是，当我检查data的内容时，它具有这些列。如何解决？

我想使用XGBRegressor预测一些数据。因此，我加载了训练数据和测试数据。 iowa_file_path ='../input/train.csv'test_data_path ='../input/test.csv'data = pd.read_csv（...

Answer 1

0
投票

只需关闭问题：

为什么XGBRegressor预测功能不匹配警告？

问题描述投票：1回答：1

1个回答

最新问题

为什么XGBRegressor预测功能不匹配警告？

问题描述 投票：1回答：1

1个回答

最新问题

问题描述投票：1回答：1