如何在python中从电子邮件中阅读pdf附件

问题描述 投票:0回答:1

我试图从我的电子邮件中提取一个Pdf附件并试图打印它,但它给了我非常糟糕的输出。我有什么方法可以从中提取文本和数字吗?继承我的代码

import imaplib
import email
import os
import io

svdir = 'P:\\'

mail = imaplib.IMAP4_SSL('imap.gmail.com',993)
mail.login("[email protected]", "examplepassword")
mail.select("Inbox")

typ, msgs = mail.search(None, '(SUBJECT "samplepdf")')
msgs = msgs[0].split()
print(msgs)

for emailid in msgs:
    resp, data = mail.fetch(emailid, "(RFC822)")

email_body = data[0][1]
m = email.message_from_bytes(email_body)

if m.get_content_maintype() != 'multipart':
    continue

for part in m.walk():
    if part.get_content_maintype() == 'multipart':
        continue
    if part.get('Content-Disposition') is None:
        continue

    filename = part.get_filename()
    fg=part.get_payload(decode=True)
    print(fg)

我很抱歉,我不能在这里发布输出因为它真的很长,我甚至无法复制它因为它使我的PC滞后。

提前致谢。

python-3.x email pdf imap
1个回答
0
投票

Python没有任何内置包来读取PDF文件。您需要使用PDF解析库,例如https://pypi.org/project/PyPDF2/

希望这可以帮助。

© www.soinside.com 2019 - 2024. All rights reserved.