我有来自twitterscraper的数据框,我正尝试从文本中删除图片URL
Input:大家好,祝你有美好的一天。 pic.twitter.com/Z1yG39NO
输出:大家好,祝你有美好的一天。
df['text'] = df['text'].apply(lambda x: re.split('https:\/\/.*[\r\n]*', str(x))[0])
我使用此代码,但只能删除https:
谢谢:-)
我有一个来自twitterscraper的数据框,我正在尝试从文本输入中删除图片URL:大家好,祝你有美好的一天。 pic.twitter.com/Z1yG39NO输出:大家好,祝你好...
import re
def cleaning_PicURL (text):
text = re.sub(r'pic.twitter.com/[\w]*',"", text)
return text
df['text'] = df['text'].apply(lambda x: cleaning_PicURL(x))