使用PyPDF2通过python加密许多PDF

问题描述 投票:1回答:1

我正在尝试创建一个循环遍历文件夹中所有文件的python程序,选择那些扩展名为“.pdf”的程序,并使用受限制的权限加密它们。我正在使用这个版本的PyPDF2库:https://github.com/vchatterji/PyPDF2。 (原始PyPDF2的修改,也允许设置权限)。我用单个pdf文件测试了它,它工作正常。我希望删除原始的pdf文件,加密的文件应保留相同的名称。这是我的代码:

import os
import PyPDF2

directory = './'

for filename in os.listdir(directory):
    if filename.endswith(".pdf"): 
        pdfFile = open(filename, 'rb')
        pdfReader = PyPDF2.PdfFileReader(pdfFile)
        pdfWriter = PyPDF2.PdfFileWriter()
        for pageNum in range(pdfReader.numPages):
            pdfWriter.addPage(pdfReader.getPage(pageNum))
        pdfFile.close()
        os.remove(filename)
        pdfWriter.encrypt('', 'ispat', perm_mask=-3904)
        resultPdf = open(filename, 'wb')
        pdfWriter.write(resultPdf)
        resultPdf.close()
        continue
    else:
        continue

它给出以下错误:

  C:\Users\manul\Desktop\ghh>python encrypter.py
  Traceback (most recent call last):
  File "encrypter.py", line 9, in <module>
  pdfReader = PyPDF2.PdfFileReader(pdfFile)
  File "C:\Users\manul\AppData\Local\Programs\Python\Python37\lib\site-packages\PyPDF2\pdf.py", line 1153, in __init__
  self.read(stream)
  File "C:\Users\manul\AppData\Local\Programs\Python\Python37\lib\site-packages\PyPDF2\pdf.py", line 1758, in read
    stream.seek(-1, 2)
  OSError: [Errno 22] Invalid argument

我有一些PDF存储在桌面上的'ghh'文件夹中。任何帮助是极大的赞赏。

python pdf encryption permissions pypdf2
1个回答
0
投票

使用pdfReader = PyPDF2.PdfFileReader(filename)会使读者工作,但是这个特定的错误是由于你的文件是空的。您可以使用os.path.getsize(filename)检查文件大小。您的文件可能已被删除,因为脚本删除了原始文件,然后使用open(filepath, "wb")创建了一个新文件,然后由于pdfWriter.write(resultPdf)发生错误而导致错误终止,并留下带有原始文件名的空文件。

如上所述,将文件名而不是文件对象传递给PdfFileReader可以解决pdfWriter发生的错误(我不知道为什么),但是您需要用原始pdf的副本替换目录中的任何空文件以获取摆脱OSError。

© www.soinside.com 2019 - 2024. All rights reserved.