pdfbox 相关问题

Apache PDFBox库是一个用于处理PDF文档的开源Java工具。该项目允许创建新的PDF文档,处理现有文档以及从文档中提取内容的功能。 Apache PDFBox还包括几个命令行实用程序。

Apache PDFBox:编码问题

我有一个PDF模板,并试图替换其中的一些单词。我使用以下代码:私有PDDocument replaceText(PDDocument文档,字符串searchString,字符串替换)引发IOException {...

回答 1 投票 0

如何使用PDFBOX在一个pdf中将pdf分成多页

[要求:我的pdf有5页,我需要在单个pdf中从第二页开始拆分,最后一页结束。目前,我已经做到了,以便每页拆分一个pdf。当前代码:...

回答 2 投票 0

为什么将PDF展平时我的复选框消失了?

我正在尝试使用PDAcroForm展平方法展平我的PDF。我创建的pdf基于创建PDFBox复选框的示例代码(我最终得到一个带有一个复选框的页面)。但是,...

回答 1 投票 3

Play框架:如何处理占用大量内存的操作?

我有一个Play Framework应用程序(Play 2.8,Scala 2.13和Java 8),该应用程序使用Apache PDFBox 2从上传的PDF文件创建JPG缩略图。缩略图是根据请求创建的,然后是...

回答 1 投票 0

使用PDFBOX将顶级书签添加到现有的PDF中

我想使用JAVA中的PDFBOX将顶级书签添加到现有的pdf文件中。不知道为什么下面的代码不起作用,有人可以帮我吗?谢谢。以下是Document.pdf ...

回答 1 投票 0

确定PDF页面包含文本还是纯图片

如何使用Java确定PDF页面是包含文本还是纯图片?我搜索了许多论坛和网站,但尚未找到答案。是否可以提取文本...

回答 2 投票 8

在使用pdfbox替换pdf中的字符串时获取/ u0000

我遇到了一个非常罕见的问题。我正在使用wkhtmlTopdf从HTML创建PDF,并获得创建良好的pdf。但是,当我想用 pdfbox替换同一字符串中的单词时,我无法...

回答 1 投票 1


将图像从PDImageXObject提取到文件中,而不将其加载到内存中

这与如何有效地从PDF中提取图像字节有关,但是我将尝试以不同的方式重述该问题,因此,它与PDF解析无关,而与图像处理有关。我正在使用PDFBox ...

回答 1 投票 0

S3文件作为对PDFBox的输入

我尝试过Apache PDFBox从PDF文件中提取内容,当我仅提取本地PDF时,效果很好。但是我要解析的实际输入PDF在S3存储桶中。我可以阅读...

回答 1 投票 0

如何获取带标签的pdf中标签的页码

我想获取带标签的PDF中标签的页码。我已经尝试过下面的代码,但不确定。 for(Object coDic:structElement.getKids()){int页面=((PDStructureElement)coDic).getCOSObject()....

回答 1 投票 -1

我正在尝试使用PDF Box加载PDF,但是PDF不会打开。我不确定我的代码有什么问题

“我不确定这到底是什么问题,所以如果有人有任何建议,可以随时给我打。我全神贯注!”私人void jButton1ActionPerformed(java.awt.event.ActionEvent evt)...

回答 1 投票 0

无法添加PDF /有效的元数据

Java:1.8 pdfbox:2.0.18印前检查:2.0.18我可以创建有效的PDF,但是我们的要求是它必须符合PDF / A标准。除了元数据,我设法解决了所有验证问题。 ...

回答 1 投票 0

Apache PDFBox找不到类'Loader'。为什么?

我正在使用pdfbox-app-2.0.18.jar或pdfbox-app-2.0.17.jar。找不到org.apache.pdfbox.Loader。...我试图在此按照示例进行操作。并尝试编写以下代码:try(...

回答 1 投票 0

获取坐标并在其上书写

我正在通过以下代码TextPosition.getXDirAdj()和TextPosition.getYDirAdj()提取(X&Y)坐标,结果是:-对于字符“ 1”,X = 79.0和Y = 31.0,但是正确的...] >

回答 1 投票 0

pdfbox-转换为灰度后pdf大小增加

我需要将扫描的PDF转换为灰度PDF。我找到了两种解决方案。第一个是只使用renderImage私有void convertToGray()引发IOException {File pdfFile = new File(PATH); ...

回答 1 投票 0

pdfBox:如何从签名字段中获取签名名称

使用itext,我可以这样获得签名名称(Signed By):fields = reader.getAcroFields(); pk = fields.verifySignature(FieldName);名称= pk.getSignName();如何获得签名名...

回答 1 投票 0

在PDFBox中,是否可以将工具提示(提示)添加到标记注释中?

概括地说,我一直在研究获取pdf的程序,突出显示一些单词(通过pdfbox标记注释obj)并保存新的pdf。我希望突出显示的单词显示工具提示,并提供一些...

回答 1 投票 1

从PDImageXObject获取图像大小

是否有一种方法可以找到PDImageXObject中图像的大小(以字节为单位,以哪种压缩图像格式存储,而不用将其提取到BufferedImage中?

回答 1 投票 1

apache pdfbox-如何测试文档是否展平?

我已经编写了以下小型Java主要方法。它接收一个(为测试目的而进行硬编码!)PDF文档,我知道该文档包含表单中的活动元素,需要对其进行展平。公共静态...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.