在熊猫中进行多个字符串清理

问题描述 投票:-1回答:1

我正在清理包含以下位置的数据框中的列:

New York City
New York, NY
New York USA
Las Vegas, Nevada
Las Vegas, NV, USA
Las Vegas North, America

如何清洁绳子,使其只返回城市,即:

New York
New York
New York
Las Vegas
Las Vegas
Las Vegas

我尝试过df.replace({'Location' : { 'New York.*' : 'New York', 'Las Vegas.*':'Las Vegas'}})和其他一些选项,但无法让它发挥作用。

任何帮助非常感谢

regex string pandas data-cleaning data-cleansing
1个回答
0
投票

这似乎有效

df['Location'] = df['Location'].str.replace(r'(^.*New York.*$)', 'New York')
df['Location'] = df['Location'].str.replace(r'(^.*Las Vegas.*$)', 'Las Vegas')

取自Replace whole string if it contains substring in pandas

© www.soinside.com 2019 - 2024. All rights reserved.