在没有循环的情况下替换Pandas列中的多个值

问题描述 投票:2回答:2

我有Pandas数据帧,想要在df的特定列上替换很多值。

如何在没有循环的情况下实现以下代码?

for i in range(len(data.loc[:, 'CityID'])):
    if data.loc[:, 'CityID'][i] == 1:
        data.loc[:, 'CityID'][i] = 1
    elif data.loc[:, 'CityID'][i] in (2, 3, 4, 21):
        data.loc[:, 'CityID'][i] = 2
    elif data.loc[:, 'CityID'][i] in (33, 34):
        data.loc[:, 'CityID'][i] = 4
    else:
        data.loc[:, 'CityID'][i] = 3
python pandas dictionary
2个回答
4
投票

你可以使用pd.Series.map的字典:

d = {1: 1, 2: 2, 3: 2, 4: 2, 21: 2, 33: 4, 34: 4}

data['CityID'] = data['CityID'].map(d).fillna(3)

如果字典结构很费力,你可以使用解包:

d = {1: 1, **dict.fromkeys((2, 3, 4, 21), 2), **dict.fromkeys((33, 34), 4}

4
投票

使用:

m1 = data['CityID'] == 1
m2 = data['CityID'].isin([2, 3, 4, 21])
m3 = data['CityID'].isin([33, 34])

data['CityID'] = np.select([m1, m2, m3], [1,2,4], default=3)
© www.soinside.com 2019 - 2024. All rights reserved.