更改分类变量的值 - PYTHON

问题描述 投票:0回答:1

我有一个如下所示的日期框:

城市_公司 主题
伦敦 医疗保健
西雅图 创业
哥本哈根 工程
墨尔本 法律
山景 b
布里斯班 c
旧金山 d

有很多主题组。我想更改名为“Other”的b、c、d。 (不仅是b,c,d,当然还有n个值..)

城市_公司 主题
伦敦 医疗保健
西雅图 创业
哥本哈根 工程
墨尔本 法律
山景 其他
布里斯班 其他
旧金山 其他
python categorical-data
1个回答
0
投票

您可以检查所需的值并替换它们 -

import pandas as pd                                                                                                         
dd = {"city_company": ["London", "Seattle", "Copenhagen", "Melbourne", "Mountain View", "Brisbane", "San Francisco"],       
                                                                                                                            
"Subject": ["Health Care", "Entrepreneurship", "Engineering", "Law", "b", "c", "d"]                                         
                                                                                                                            
}                                                                                                                           
df = pd.DataFrame(dd)                                                                                                                                                                          
df.loc[df['Subject'].isin(['b', 'c', 'd']), ["Subject"]] = "Other"                                                                           
© www.soinside.com 2019 - 2024. All rights reserved.