在python我需要删除第一个字母

问题描述 投票:-2回答:3

我有一个大型数据框如下:

df1(样本数据)

a      name       keywords
1      ramesh     rrahul,rapple
2      venkat     rtemple
3      rajesh     rcake,rphone,rmaths
4      lamda      rcon
5      feast      rcamera,rtab

我想删除字母r,它出现在由逗号分隔的单词组成的字符串中每个单词的开头。输出应如下:

a      name       keywords
1      ramesh     rahul,apple
2      venkat     temple
3      rajesh     cake,phone,maths
4      lamda      con
5      feast      camera,tab
python string pandas
3个回答
2
投票

使用str.replaceregex模式:

import re
pat = re.compile(r'^r|(?<=,)[r]')
df['keywords'] = df.keywords.str.replace(pat,'')

要么:

df['keywords'] = df.keywords.str.replace(r'^r|(?<=,)[r]','')

print(df)
   a    name          keywords
0  1  ramesh       rahul,apple
1  2  venkat            temple
2  3  rajesh  cake,phone,maths
3  4   lamda               con
4  5   feast        camera,tab

正则表达式的解释:

  1. ^r检查字符串开头是否有r
  2. (?<=,)[r]检查每个r后是否有,

jezrael的列表理解方法比str.replace快,而如果你有null / NaN值,那么str.replace可以照顾那些没有喧嚣的人。


6
投票

使用嵌套列表理解与joinsplit

注意:

假设没有null / NaNs值。

df['keywords'] = [','.join(y[1:] for y in x.split(',')) for x in df['keywords']]
print (df)
   a    name          keywords
0  1  ramesh       rahul,apple
1  2  venkat            temple
2  3  rajesh  cake,phone,maths
3  4   lamda               con
4  5   feast        camera,tab

如果可能的话,有时候不存在r的第一个字母可能与if-else有点变化的解决方案:

print (df)
   a    name             keywords
0  1  ramesh            aa,rapple
1  2  venkat              rtemple
2  3  rajesh  rcake,rphone,rmaths
3  4   lamda                 rcon
4  5   feast         rcamera,rtab

df['keywords'] = [','.join(y[1:] if y[0] == 'r' 
                                 else y 
                                 for y in x.split(',')) for x in df['keywords']]
print (df)
   a    name          keywords
0  1  ramesh          aa,apple
1  2  venkat            temple
2  3  rajesh  cake,phone,maths
3  4   lamda               con
4  5   feast        camera,tab

1
投票
df["keywords"] = df["keywords"].apply(lambda x: ",".join([w[1:] if w[0] == "r" else w for w in x.split(",")]) )
df

a   name    keywords
1   ramesh  rahul,apple
2   venkat  temple
3   rajesh  cake,phone,maths
4   lamda   con
5   feast   camera,tab
© www.soinside.com 2019 - 2024. All rights reserved.