pdfbox 相关问题

Apache PDFBox库是一个用于处理PDF文档的开源Java工具。该项目允许创建新的PDF文档,处理现有文档以及从文档中提取内容的功能。 Apache PDFBox还包括几个命令行实用程序。

使用 PDFBox 从 PDF 中删除图像

我想使用 PDFBox 库删除页面中显示的某些图像。据我所知,识别图像的最合适方法是 XOBJECT 目录中的“名称”。所以理论上...

回答 1 投票 0

如何使用 PDFBox 将文档中逐页提取的文本复制到新的 PDF 文档中?

我想将原始 PDF 文档的文本复制到新的 PDF 文档中,并保留源文本的格式。 我已经做了一些测试,但是复制文本的结果 进入...

回答 1 投票 0

如何将PDF页面的内容旋转到任意角度?

我需要将PDF页面的内容旋转任意角度,而PDPage.setRotation(int)命令被限制为90度的倍数。 页面的内容是矢量和文本,我

回答 2 投票 0

PDFBox 提取段落

我是pdfbox新手,我想提取与某些特定单词匹配的段落,并且我能够将整个pdf提取到文本(记事本),但我不知道如何提取特定段落...

回答 6 投票 0

如何使用 apache pdfbox 添加水印

我正在现有的 pdf 上添加水印。 据我所知,有两种方法可以实现这一目标。 为文本制作透明图像 将叠加 pdf 添加到原始 pdf 但无论哪种方式我都只是覆盖......

回答 1 投票 0

U+011B('ecaron')在 Helvetica 字体中不可用,编码:WinAnsiEncoding

使用 PDFBox 版本 2.0.27。 这是我的代码: 包 com.mytest.tasks.createPDF; 导入 org.apache.pdfbox.pdmodel.PDDocument; 导入 org.apache.pdfbox.pdmodel.PDPage; 导入 org.apache.pdfbox.pdm...

回答 1 投票 0

如何将度量字典添加到 PDDocument

我正在尝试通过 PDFBox 从地理参考 PNG 图像创建 GeoPDF。 PDF 创建本身没有问题,因为有很多示例 在网络上执行该任务。不过,我需要一些...

回答 1 投票 0

更改 pdf 的 CropBox 和文本颜色

我有一个 pdf 文件,在我的电子阅读器上几乎无法阅读。 页边距较大,导致文本较小。 文本颜色是浅灰色,在我的设备屏幕上渲染得非常微弱......

回答 1 投票 0

如何从 pdf 中提取视口并根据视口修改注释的边界矩形?

我已经实现了使用 pdfbox 将链接注释添加到任何 pdf 的功能。它适用于大多数 pdf,但对于某些 pdf,它没有将标记放置在正确的坐标处。当我打开...

回答 1 投票 0

如何使用 PDFBox 调整 XObject 中的运算符和操作数

使用 PDFContentStreamEditor.class 可以操作 PDF 主页面内容的运算符和操作数。 看来 XObjects 不是由编辑器编辑的。我的问题是如果...

回答 1 投票 0

ItextPDF 迁移到 pdfbox

我有以下代码,我正在将其从itextpdf迁移到pdfbox.. @RequestMapping(值 = "/displaypdf.action", 方法 = RequestMethod.GET) 公共无效显示pdf(

回答 1 投票 0

Html 到 Pdf 转换后的 pdf 对于某些字符有“#”[重复]

我正在使用 openhtmltopdf 库将 HTML 转换为 PDF,但转换后的 PDF 使用“#”而不是“Ç”、“ş”、“Ş”、“ç”、“Ç”、&quo...

回答 1 投票 0

将自定义字体嵌入到由 HTML 创建的 PDF 中

我使用 jsoup 和 OpenHTMLToPDF 从 HTML 创建 PDF。我必须在 PDF 中使用不同的字体来覆盖非拉丁字形(请参阅此处)。如何正确嵌入我的字体? 简化的程序

回答 3 投票 0

openhtmltopdf - Html 到 Pdf 转换后的 pdf 某些字符包含“#”

我正在使用 openhtmltopdf 库将 html 转换为 pdf,但转换后的 pdf 添加了“#”,而不是“Ç”、“ş”、“Ş”、“ç”、“Ç”、“Ö&

回答 1 投票 0

最小 JRE 出现 PDFBOX 3.0.1 加载程序异常 - 缺少什么模块

我收到 PDFBOX 3.0.1 的以下异常: org.apache.pdfbox.Loader.loadPDF(Loader.java:369) 处的 java.lang.ExceptionInInitializerError 我仅在使用 ...

回答 1 投票 0

PDDocument.load(url) 不是方法

我目前正在使用 PDFBox 版本 3.0.1,在尝试从 URL 加载 PDF 时遇到挑战。似乎没有为此目的提供特定方法。 下面是...

回答 1 投票 0

PDFBox 2.0.25 java.io.IOException:未知的目录对象 c='>' cInt=62 peek='>' peekInt=62 位于偏移量 26096 (起始偏移量:26096)

我使用 PDFBox 版本 2.0.25 出现错误 java.io.IOException:未知的目录对象 c='>' cInt=62 peek='>' peekInt=62 位于偏移量 26096 (起始偏移量:26096) 错误代码行是 PDDocume...

回答 2 投票 0

解析方法“javax/imageio/metadata/IIOMetadata.getAsTree(Ljava/lang/String;)Lorg/w3c/dom/Node

我正在 Websphere ND 9.0.5.13 上使用 Apahce Pdfbox 2.0.30,该版本在 Java 8 上运行 应用程序类加载器设置为 Parent Last 我的POM文件如下: <

回答 1 投票 0

如何通过 Apache PDFBox 将混合模式添加到 PDF 元素

我利用 PDContentStreamEditor.class 从 PDF 页面元素转换颜色空间。我看到有 PDExtendedGraphicsState.class 可以设置 BlendMode。

回答 1 投票 0

初始化 python 包 pdfbox 让我脱离了 python

我使用Pip安装pdfbox。当我尝试在 REPL 中导入它时,它会退出解释器: PS D:\AssetExtraction> python Python 3.8.5(标签/v3.8.5:580fbb0,2020 年 7 月 20 日,15:57:54)[MSC v.1924 6...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.