我正在尝试使用PyPDF2完整地复制PDF,以下代码复制内容但不复制pdf的大纲。
here is a sample pdf并使用以下代码python test.py <input pdf> <output dest>
这是我到目前为止的代码。
from PyPDF2 import PdfFileWriter, PdfFileReader
import sys
import os.path
def main(argv):
if not os.path.isfile(argv[0]) and \
not os.path.isfile(argv[1]):
print("Invalid path")
sys.exit()
input_pdf = PdfFileReader(open(argv[0], "rb"))
output_pdf = PdfFileWriter()
input_pdf_pages = input_pdf.getNumPages()
for i in range(0, input_pdf_pages):
output_pdf.addPage(input_pdf.getPage(i))
output_pdf.write(open(argv[1], "wb"))
if __name__ == "__main__":
main(sys.argv[1:])
PdfFileWriter
确实有许多复制整个文件的方法:appendPagesFromReader
,cloneReaderDocumentRoot
和cloneDocumentFromReader
。
但是,我也无法使它们正常工作。 ;-)你可能会有更好的运气。