我试图在PyPDF2文件中使用PdfFileReader函数,每当我尝试打开文件时,我都会收到一条错误消息,提示我试图读取一个空文件,当我查看pdf信息时,它说是5 MB,所以我认为它不为空
我使用此链接下载了pdf文件:https://ir.aboutamazon.com/static-files/35fa4e12-78bd-40bc-a700-59eea3dbd23b
以前,如果没有将txt文件保存到与py文件相同的文件夹中,我在打开txt文件时会遇到错误,但我认为这不适用于这种情况。
我想知道文件如何为空,或者我在PyPDF2中使用pdf阅读器功能是否不正确。由于某种原因该文件无法打开。我也尝试下载并创建许多其他pdf。
import PyPDF2
#Pdf of Amazon's proxy report for 2019
pdf = 'Amazon.pdf'
file = PyPDF2.PdfFileReader(open(pdf, "rb"))
追踪(最近通话): 文件“ /Users/jason/Desktop/untitled-1.py”,第5行,在 档案= PyPDF2.PdfFileReader(open(pdf,“ rb”)) init中的文件“ /Users/jason/miniconda3/lib/python3.6/site-packages/PyPDF2/pdf.py”,第1084行 self.read(流) 文件“ /Users/jason/miniconda3/lib/python3.6/site-packages/PyPDF2/pdf.py”,第1691行,已读取 引发utils.PdfReadError('无法读取空文件')PyPDF2.utils.PdfReadError:无法读取空文件
创建一个帐户,因为当有人找到解决方案并且不共享时,我讨厌它。
帮助我将文件的当前位置设置为0的原因
pdf.seek(0)
使用PdfFileReader之前