pypdf2 相关问题

PyPDF2是一个纯python PDF库,能够分割,合并,裁剪和转换PDF文件的页面。它还可以向PDF文件添加自定义数据,查看选项和密码。它可以从PDF中检索文本和元数据,以及将整个文件合并在一起。

有没有更快的方法来合并两个文件,而不是逐页合并?

我在Python 3上使用PyPDF2,为了在新生成的PDF中添加页码(我使用reportlab做的),我以如下方式逐页合并两个PDF文件:从PyPDF2导入......。

回答 1 投票 0

PDF页面分割 - PDF大小增加

我已经创建了一个使用PyPDF2的PDF分割器。它将超过20Mb大小的PDF分割成多个较小的PDF。我使用的逻辑是将所有的页面分割成单页PDF,找到每个 ...

回答 1 投票 0

ImportError 没有命名为'PyPDF2'的模块。

我是Python新手......,实际上是一般的编程新手,所以请耐心等待。在Ubuntu 20.04上(是的,我也是Linux新手),使用Python 3.8.2,我试图运行一个使用PyPDF2的脚本。我...

回答 1 投票 0

使用PyPDF2将从pdf文件中提取的页面数据转换为csv文件。

我已经从一个pdf文件中提取了数据,但我无法将其转换为csv文件 import PyPDF2 as PDFfile = open("path", "rb") pdfread = PDF.PdfFileReader(PDFfile) page = pdfread.getpage(...)

回答 1 投票 0

使用Pypdf2从网页转换的pdf中提取文本。

我使用chrome将一个网页转换为Pdf,使用保存为pdf选项。现在的问题是,当我使用PyPDF2提取数据时,它显示为Null,而在其他pdf文件上却很容易工作。I ...

回答 1 投票 0

如何使PDF显示文件名而不是标题使用程序?

https:/community.adobe.comt5acrobatdefault-to-show-file-name-vs-title-of-doc-when-converting-from-word-to-pdftd-p9673161我想为一堆PDF文件显示文件名而不是标题。I ...

回答 1 投票 0

读取PDF文件时出现断言错误 python - pypdf2

当我试图读取一个PDF文件时,我得到了以下错误。代码: from PyPDF2 import PdfFileReader import os.chdir("Path to dir") pdf_document = 'sample.pdf' pdf = PdfFileReader(pdf_document,'...)

回答 1 投票 0

使用pypdf2从chrome的打印选项提取pdf文件中的文本。

试图使用python(v 3.8.2)模块pypdf2(v 1.26.0)从pdf文件中提取文本。除了特定的pdf文件(从chrome打印选项中生成的)之外,一切都很好,我把这些文件放在 ...

回答 1 投票 0

使用Python PyPDF2从扫描的pdf(图像)中提取文本[已关闭]。

我一直试图从扫描的PDF中提取文本(具有不可选择文本的图像)。但是,我得到的输出,这是不是一个人可读。我想要包含日期、......等信息。

回答 1 投票 0

当使用PyPDF2合并文件时,出现'OSError: 当使用PyPDF2合并文件时,出现"[Errno 22]无效参数"。

我只是想用python,特别是PyPDF2来合并一些PDF文件。很简单,但由于某些原因,我得到了一个错误,这根本不明白。在寻找解决方案的同时,我...

回答 1 投票 0

如何使用pypdf2打开pdf文件?

我试着在google colab中用pypdf打开pdf文件,但出现了错误,我把模式形式 "r "改为 "r+",但不能解决问题。我把模式形式 "r "改为 "r+",但问题没有解决。我搜索了一下解决这个问题的方法,在我母 ...

回答 1 投票 0

使用python将一个pdf分割成多个不同页数的pdf文件。

我有一个350页的pdf文件,里面有多张电费单,但每张电费单的长度不一样,有的只有1页,有的有2或3页。我需要分割这个pdf...

回答 1 投票 0

将文件上传到gs桶中以进行循环

在下面的代码中,一个pdf文档被分割并保存在我的本地驱动器中,一旦分割过程完成,上传过程就会开始。在上传过程中,所有拆分的文件都将是...

回答 1 投票 0

使用python将文件夹结构中的多个文件夹中的多个pdf合并为1个PDF

我想将多个PDF合并为1个PDF。我们正在谈论数千个PDF。这些文件另外存储在不同的文件夹中。但它们全都位于1个主文件夹的简单示例中:Main ...

回答 1 投票 0

FileNotFound错误/使用PyPDF2和os.listdir()读取PDF文件

[我有以下脚本将几个PDF合并在一起:导入PyPDF2导入sys导入os输入= sys.argv [1]列表= os.listdir(inputs)合并= PyPDF2.PdfFileMerger()用于列表中的pdf: ..

回答 1 投票 0

PyPDF2.utils.PdfReadError:文件不为空时无法读取空文件

[我试图在PyPDF2文件中使用PdfFileReader函数,每当我尝试打开文件时,我都会收到一条错误消息,提示我正在尝试读取一个空文件,当我查看pdf信息时会显示.. 。

回答 1 投票 1

PyPDF2:从zip文件读取pdf

我正在尝试让PyPDF2读取一个简单zip文件中的一个.pdf小文件。到目前为止,这是我得到的:以zipfile.ZipFile(“ TEST.zip”)的形式将PyPDF2,zipfile导入为z:filename = z ....

回答 1 投票 0

'import pyPDF2'结果为'ModuleNotFoundError'

问题的总结:使用python解释器,即使安装了pyPDF2模块,我也会输入'import pyPDF2'并出现ModuleNotFound错误:import pyPDF2 Traceback(...

回答 1 投票 0

合并PDF,同时保留自定义页码(又称页面标签)和书签

我正在尝试自动合并多个PDF文件,并且有两个要求:a)现有书签,以及b)必须保留页面标签(自定义页面编号)。合并时保留书签...

回答 1 投票 1

Python / PyPDF4:如何在创建的PDF中指定/ PageLabels?

我正在使用PyPDF4来创建期刊“自然”的离线可读版本。我使用PyPDF4 PdfFileReader读取单个文章PDF,并使用PdfFileWriter创建单个合并的输出。 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.