我在DataFrame中有电子邮件文本数据。而且我看到一些电子邮件中包含他们的签名,上面写着他们所在公司的部门,如下所示>
================================== ABCD corporation IT department Name Email ==================================
为了进行数据分析,我不需要这些签名部分,因此我有点想摆脱它们。我列出了这些分隔符,例如人们用于签名的“ ===”和“ ----”。因此,我有点想编写一个代码,如果“ ==”出现超过4次或更多,则会剪切其中的所有文本。有什么pythonic方法可以实现吗?
我在DataFrame中有电子邮件文本数据。而且我看到一些电子邮件中包含他们的签名,上面写着他们所在公司的部门,例如以下================================ === ABCD ...
stri="""
jshsb sjhsvs jwjj bla bla bla
==================================
ABCD corporation
IT department
Name
Email
==================================
"""
stri=stri.split()
for i in range(len(stri)):
if ('====' in stri[i]) or ('----' in stri[i]):
stri=stri[:i]
break
print(' '.join(stri))