我正在尝试创建一个循环遍历文件夹中所有文件的python程序,选择那些扩展名为“.pdf”的程序,并使用受限制的权限加密它们。我正在使用这个版本的PyPDF2库:https://github.com/vchatterji/PyPDF2。 (原始PyPDF2的修改,也允许设置权限)。我用单个pdf文件测试了它,它工作正常。我希望删除原始的pdf文件,加密的文件应保留相同的名称。这是我的代码:
import os
import PyPDF2
directory = './'
for filename in os.listdir(directory):
if filename.endswith(".pdf"):
pdfFile = open(filename, 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFile)
pdfWriter = PyPDF2.PdfFileWriter()
for pageNum in range(pdfReader.numPages):
pdfWriter.addPage(pdfReader.getPage(pageNum))
pdfFile.close()
os.remove(filename)
pdfWriter.encrypt('', 'ispat', perm_mask=-3904)
resultPdf = open(filename, 'wb')
pdfWriter.write(resultPdf)
resultPdf.close()
continue
else:
continue
它给出以下错误:
C:\Users\manul\Desktop\ghh>python encrypter.py
Traceback (most recent call last):
File "encrypter.py", line 9, in <module>
pdfReader = PyPDF2.PdfFileReader(pdfFile)
File "C:\Users\manul\AppData\Local\Programs\Python\Python37\lib\site-packages\PyPDF2\pdf.py", line 1153, in __init__
self.read(stream)
File "C:\Users\manul\AppData\Local\Programs\Python\Python37\lib\site-packages\PyPDF2\pdf.py", line 1758, in read
stream.seek(-1, 2)
OSError: [Errno 22] Invalid argument
我有一些PDF存储在桌面上的'ghh'文件夹中。任何帮助是极大的赞赏。
使用pdfReader = PyPDF2.PdfFileReader(filename)
会使读者工作,但是这个特定的错误是由于你的文件是空的。您可以使用os.path.getsize(filename)
检查文件大小。您的文件可能已被删除,因为脚本删除了原始文件,然后使用open(filepath, "wb")
创建了一个新文件,然后由于pdfWriter.write(resultPdf)
发生错误而导致错误终止,并留下带有原始文件名的空文件。
如上所述,将文件名而不是文件对象传递给PdfFileReader
可以解决pdfWriter
发生的错误(我不知道为什么),但是您需要用原始pdf的副本替换目录中的任何空文件以获取摆脱OSError。