pypdf2 相关问题

PyPDF2是一个纯python PDF库,能够分割,合并,裁剪和转换PDF文件的页面。它还可以向PDF文件添加自定义数据,查看选项和密码。它可以从PDF中检索文本和元数据,以及将整个文件合并在一起。

从pdf搜索多个单词

我正在尝试编写一个Python脚本,该脚本将在pdf文件中查找特定的单词。现在,我必须滚动结果以找到找到它的行。我想要包含单词...

回答 1 投票 0

在不更改布局和格式的情况下从python中的pdf中提取文本的最佳方法是什么?

我想从pdf获得具有确切格式和布局的文本。如果不是直接将pdf转换为文本,是否可以执行pdf-> xml->文本?我已经尝试过PyPDF2,pdfminer和pdftotxt。甚至我都...

回答 1 投票 0

如何使用pyPDF2反转多个PDF文件的顺序?

我想做的-我想颠倒大约10个PDF的顺序。我所做的-我在这里找到了一种非常好的方法。 (非常感谢这篇文章):如何反转...

回答 2 投票 1

如何使用Python中的Word模板生成pdf文件?

我需要在Python中生成pdf文件。我创建了一个Word模板文件(Word XML文档),该文档中带有占位符。我动态填充占位符,并可以创建一个单词...

回答 1 投票 -1

分割PDF以使多个PDF小于20Mb

我是Python编程的新手,但拥有5年以上的编码经验。我必须将大型PDF拆分为小于20Mb的较小PDF。我目前使用以下逻辑编写代码。查找...

回答 3 投票 1

从Python提取PDF文本

我正在尝试从python中的PDF中读取数据,而我正试图使用 repl.it文件,只是因为它更容易测试不同的库。我已经尝试了PyPDF2和PyPDF4,它们可以工作,但不能...

回答 1 投票 0

使用PDF阅读器获取文本?

阅读pdf时,如何只获得这种简单的文本? CLSAI10608此代码始终以CLXXXXXXXX开头,LEN =10。代码:import PyPDF2 file = open('document.pdf','rb')pdfreader = PyPDF2 ....

回答 1 投票 0

将文件夹中的所有pdf文件与pypdf2合并为一个pdf

我想用PyPDF2合并目录中的所有PDF。我尝试了pypdf中的代码,将多个pdf文件合并为PyPDF2的一个pdf导入PdfFileMerger,PdfFileReader合并= PdfFileMerger()...

回答 1 投票 0

pypdf2没有定义

新的Python 3.7版本。尝试使用pypdf2但我有,我不能由我自己解决了一个错误:我的COMAND:pdfFile2 =开放(R “C:\用户\卢卡\桌面\ python的\教程\ doc2.pdf”, “WB”)# W =写,R = ...

回答 2 投票 0

ImageMagick的&PyPDF2崩溃的Python一起使用时

我有包括大约20〜25页的PDF文件。这个工具的目的是分裂的PDF文件转换成网页(使用PyPdf2),挽救每一个PDF页面(使用PyPdf2)目录,转换的PDF页面...

回答 1 投票 0

“PDF文件尚未解密”问题仍存在于PyPDF2中

使用PyPDF2读取PDF文件时出现以下错误引发utils.PdfReadError(“文件尚未解密”)PdfReadError:文件尚未解密我一直在尝试阅读PDF ...

回答 1 投票 1

如何使用python处理内存中的PDF?

背景:我有一个包含多个页面的PDF文件(LARGE_PDF)。每个页面都包含一个表,没有其他内容。每张桌子都不一样。我想提取表内容并将它们放到...

回答 1 投票 0

PyPDF2压缩

我正在努力使用PyPDF2模块来压缩我合并的pdf。这是我的尝试基于http://www.blog.pythonlibrary.org/2012/07/11/pypdf2-the-new-fork-of-pypdf/ import PyPDF2 path = open('...

回答 1 投票 1

如何在PyPDF2中使用addLink()?

addLink(pagenum,pagedest,rect,border = None,fit ='/ Fit',* args)参数:pagenum(int) - 放置链接的页面的索引。 pagedest(int) - 链接所在页面的索引...

回答 1 投票 0

阅读目录中的所有PDF(图像)

我附上了一张图片,以帮助展示我所做的一切。我正在尝试编写一个程序,该程序将向目录中具有奇数页数的所有PDF添加空白页。但是我似乎无法......

回答 3 投票 0

带有括号的正则表达式,来自PyPDF2和DataFrame的字符串,带有正数和负数

我目前正在使用一个脚本,通过PyPDF2将PDF拉到字符串,然后使用正则表达式在PDF中搜索费用金额。然后对这些费用进行求和和操纵......

回答 1 投票 1

如何在Python 3中删除pdf中的注释

我最初的目标是删除PDF页面上的大量白边。然后我发现这个目的可以通过使用下面的代码缩放页面来实现,但注释不会缩放。进口......

回答 1 投票 2

使用pypdf2更改pdf文件的元数据

我想将元数据键值对添加到pdf文件的元数据中。我找到了几年的答案,但我认为这是复杂的方法。我想今天有一种更简单的方法:https:// ...

回答 3 投票 1

如何将从PDF中提取的文本格式化为python中的json

我使用pyPDF2以文本格式提取了一些发票PDF。我想将此文本文件转换为仅包含重要关键字和标记的json文件。输出应该是......

回答 1 投票 1

在python中的pdf中添加基于关键字的书签

我正在尝试根据pdf文件中的关键字创建pdf书签。我可以使用pypdf2的addbookmark函数为pdf页面创建书签。但它是基于页面的,而不是基于关键字的。 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.