我正在使用Titanic数据集。我对3个幸存的类别(性别,客舱)做了oneHotEncoding。
encoder = OneHotEncoder(categories='auto',
drop='first',
sparse=False,
handle_unknown='error')
encoder.fit(X_train.fillna('Missing'))
tmp = encoder.transform(X_train.fillna('Missing'))
onepd = pd.DataFrame(tmp, columns= encoder.categories_)
ecoder.categories_数组大小与tmp不同。有什么办法吗?
encoder.categories_是一个矩阵,可以尝试索引第一个元素:
尝试一下:
encoder = OneHotEncoder(categories='auto',
drop='first',
sparse=False,
handle_unknown='error')
encoder.fit(X_train.fillna('Missing'))
tmp = encoder.transform(X_train.fillna('Missing'))
onepd = pd.DataFrame(tmp, columns= encoder.categories_[0])