在匹配的单词Pandas之前提取单词

Question

您好，我正在尝试在Python中匹配的单词之前提取单词。

例如：

import pandas as pd
import re
data = [' 123 DIR FOOD CITY','124 DIR DRINK CITY','143 STREET CANDY CITY','186 ROAD APPLE CITY']
df = pd.DataFrame(data, columns = ['ADDR'])

我正在尝试提取单词“ FOOD”，“ DRINK”，“ CANDY”和“ APPLE”。我想要的输出是：

ADDR                        CITY
123 DIR FOOD CITY           FOOD
124 DIR DRINK CITY          DRINK
143 STREET CANDY CITY       CANDY
186 ROAD APPLE CITY         APPLE

这是我尝试过的，但没有任何效果。

df['CITY'] = df['ADDR'].apply(lambda x: ' '.join(re.findall(r'(\w+)\s+CITY',x)))

我不太擅长使用正则表达式，我的代码有什么问题？

非常感谢您的帮助！

Answer 1

使用extract和正则表达式：

df['CITY'] = df['ADDR'].str.extract('.*\s(?P<CITY>.*)\sCITY')

输出：

                    ADDR   CITY
0      123 DIR FOOD CITY   FOOD
1     124 DIR DRINK CITY  DRINK
2  143 STREET CANDY CITY  CANDY
3    186 ROAD APPLE CITY  APPLE

使用n = 2的rsplit的另一种方法，

df['CITY'] = df['ADDR'].str.rsplit(' ', n=2).str[1]

在匹配的单词Pandas之前提取单词

问题描述投票：-1回答：1

1个回答

最新问题

在匹配的单词Pandas之前提取单词

问题描述 投票：-1回答：1

1个回答

最新问题

问题描述投票：-1回答：1