PyPDF2是一个纯python PDF库,能够分割,合并,裁剪和转换PDF文件的页面。它还可以向PDF文件添加自定义数据,查看选项和密码。它可以从PDF中检索文本和元数据,以及将整个文件合并在一起。
我想通过PyPDF2将pdf文件转换为文本,但转换后的文本看起来与PDF文件不同。具体来说,PDF中的一行在文本中被分成多行,并且单词也可能被破坏。 ...
在发送带有相关pdf附件的多封电子邮件时显示空白的pdf附件
我是python的新手,有一个任务是发送多个带有相关附件的电子邮件。我会详细说明,一个文件夹包含多个pdf文件,每个文件包含一些文本,包括电子邮件id.I ...
我正在尝试创建一个循环遍历文件夹中所有文件的python程序,选择那些扩展名为“.pdf”的程序,并使用受限制的权限加密它们。我正在使用这个版本...
我有一个项目,我需要填写预制PDF文件,想到实现这一目标的最合理的解决方案是将预制PDF格式化为PDF格式,以便有标签输入...
我有问题,需要你的帮助。我通过“使用Python自动化无聊的东西”来学习Python。我目前在第13章,处理PDF文件和Word文档。我有这些代码......
我正在尝试在给定的边界矩形中提取pdf的文本。我知道有pdf抓取工具,如pdfminer,pypdf和pdftotext。我已经尝试了所有3个,所以......
无法使用Selenium / Python 3.x下载PDF,但它可以在我手动操作时使用
我读了很多关于我的查询的答案,但找不到具体的东西。因此问这里的情况,在网页上,当我点击下载按钮时,它下载一个PDF文件......
我需要一些帮助来弄清楚为什么这不能按预期工作。以下代码,打开PDF文件,提取文本,并根据PDF的名称保存单个文本文件...
我想从目录中的pdf提取文本到另一个目录中的文本文件(转换PDF => .txt)与PyPDF2我已经在这里阅读了这些信息:https://automatetheboringstuff.com / ...
我想使用Python在pdf文件中编辑一些信息。我尝试使用Pypdf2从pdf文件中提取文本但无法编辑它。以前有人为此工作吗?
我正在尝试打开pdf来获取页数。我正在使用PyPDF2。这是我的代码:def pdfPageReader(fileName):try:pdf_file = open(fileName,'rb')read_pdf = PyPDF2 ....
使用python突出显示pdf文件中的文本内容并保存屏幕截图
我有一个pdf文件列表,我需要在这些文件的每个页面上突出显示特定文本,并为每个文本实例保存快照。到目前为止,我能够突出显示文本并保存...
我正在尝试过滤我的目录中的所有文件(pdf,txt,csv,ipynp等),以查找与我的正则表达式匹配的单词。到目前为止,我制作了一个程序(如下所示),可以读取csv和pdf文件,但其他...
我试图读取我的目录中的所有文件并输出包含正则表达式的文件以及每个文件中的正则表达式。 import glob import重新导入PyPDF2#---------------------------- ...
所以,我想在整个目录中搜索包含正则表达式列表的文件。其中包括:目录,pdfs和csv文件。我只能在搜索时成功完成这项任务......
我正在尝试使用PyPDF2完整地复制PDF,以下代码复制内容但不复制pdf的大纲。这是一个示例pdf并使用如下代码python test.py
我需要PYTHON脚本中的帮助来阅读PDF文件并复制它上面的每个单词并将它们放在一个新的.txt文件中(每个单词必须占用1行);然后删除重复的单词并在那之后计算它们......
我希望在纯python中将一堆小pdf有效地连接在内存中。具体来说,通常的情况是500个单页pdf,每个都有大约400 kB的大小,要合并......
我试图使用Python从PDF文件中提取文本。我的主要目标是我正在尝试创建一个程序来读取银行对帐单并提取其文本以更新excel文件以轻松记录...
我想将自定义元数据添加到pdf文件中。这可以通过pypdf2或pdrw库来实现。我已经提到pdf文件的更改元数据与pypdf2解决方案工作正常,当...之间没有空格时...