截取文本的特定部分

问题描述投票：0回答：1

我在DataFrame中有电子邮件文本数据。而且我看到一些电子邮件中包含他们的签名，上面写着他们所在公司的部门，如下所示>

==================================
ABCD corporation
 IT department
 Name
 Email
==================================
为了进行数据分析，我不需要这些签名部分，因此我有点想摆脱它们。我列出了这些分隔符，例如人们用于签名的“ ===”和“ ----”。因此，我有点想编写一个代码，如果“ ==”出现超过4次或更多，则会剪切其中的所有文本。有什么pythonic方法可以实现吗？

我在DataFrame中有电子邮件文本数据。而且我看到一些电子邮件中包含他们的签名，上面写着他们所在公司的部门，例如以下================================ === ABCD ...

python pandas

1个回答

1
投票

stri="""
jshsb sjhsvs jwjj bla bla bla
==================================
ABCD corporation
 IT department
 Name
 Email
==================================
"""

stri=stri.split()
for i in range(len(stri)):
    if ('====' in stri[i]) or ('----' in stri[i]):
        stri=stri[:i]
        break

print(' '.join(stri))

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.