我努力将我的数据划分为用于特征工程的分类。数据是我要按类别数据分组的销售价格(邻里)。
我在做什么错-我为所有行都获得了NaN
值?谢谢!
pricy_location = train['SalePrice'].groupby(train['Neighborhood']).mean()
label = ['rank1', 'rank2', 'rank3', 'rank4', 'rank5']
train['Pricy_Loc'] = pd.qcut(pricy_location, 5, labels=label, precision=2)
train['Pricy_Loc'].head()
数据及其更多信息在这里,很抱歉没有添加它:)https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data