我的二手车价格预测数据集中有一列名为“Owner_Type”。它有四个唯一值,即['第一'、'第二'、'第三'、'第四']。现在,最有意义的顺序是第一>第二>第三>第四,因为价格相对于该顺序下降。如何使用 OrdinalEncoder() 为值指定此顺序?请帮助我,谢谢!
OrdinalEncoder 有一个
categories
参数,它接受类别数组列表。这是一个代码示例:
from sklearn.preprocessing import OrdinalEncoder
enc = OrdinalEncoder(categories=[['first','second','third','forth']])
X = [['third'], ['second'], ['first']]
enc.fit(X)
print(enc.transform([['second'], ['first'], ['third'],['forth']]))