我试着用以下方法打开一个pdf文件 pypdf
在谷歌Colab中使用
import PyPDF2 as pdf2
with open("sample.pdf", "r+") as f:
pdf = pdf2.PdfFileReader(f)
但我得到以下错误。
UnsupportedOperation: can't do nonzero end-relative seeks
将模式形式 "r "改为 "r+"不能解决问题。这个错误的原因是什么,我怎么解决?
根据 此错误报告,你需要用 mode='rb'
.
import PyPDF2 as pdf2
with open ("sample.pdf", "rb") as f:
pdf = pdf2.PdfFileReader(f)
一个简单的程序打开一个pdf文件并打印它的第一页,将如下。
import PyPDF2
pdfFileObj = open('example.pdf', 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
print(pdfReader.numPages) # printing number of pages in pdf
pageObj = pdfReader.getPage(0)
print(pageObj.extractText()) # extracting text from page 0
pdfFileObj.close()