截取文本的特定部分

问题描述 投票:0回答:1

我在DataFrame中有电子邮件文本数据。而且我看到一些电子邮件中包含他们的签名,上面写着他们所在公司的部门,如下所示>

==================================
ABCD corporation
 IT department
 Name
 Email
==================================

为了进行数据分析,我不需要这些签名部分,因此我有点想摆脱它们。我列出了这些分隔符,例如人们用于签名的“ ===”和“ ----”。因此,我有点想编写一个代码,如果“ ==”出现超过4次或更多,则会剪切其中的所有文本。有什么pythonic方法可以实现吗?

我在DataFrame中有电子邮件文本数据。而且我看到一些电子邮件中包含他们的签名,上面写着他们所在公司的部门,例如以下================================ === ABCD ...

python pandas
1个回答
1
投票
stri="""
jshsb sjhsvs jwjj bla bla bla
==================================
ABCD corporation
 IT department
 Name
 Email
==================================
"""

stri=stri.split()
for i in range(len(stri)):
    if ('====' in stri[i]) or ('----' in stri[i]):
        stri=stri[:i]
        break

print(' '.join(stri))
© www.soinside.com 2019 - 2024. All rights reserved.