我有一个数据框,其中一列中我只想保留字符串的子集。在下面的示例中,我只想保留人们的名字。
**示例:**
column 1
1.Joe Smith, NYC(212)
2.Jane Doe, HOU(713)
删除我使用过的名字中剩下的所有内容
df['column1'] = df['column1'].str.lstrip("0123456789.")
这成功了。但我无法弄清楚从逗号开始的名称。不确定 RegEx 是否更适合这里?
谢谢!
尝试使用正则表达式提取名称,
df['column1'].str.extract(r'\d+\.(.+?),')