pdfbox 相关问题

Apache PDFBox库是一个用于处理PDF文档的开源Java工具。该项目允许创建新的PDF文档,处理现有文档以及从文档中提取内容的功能。 Apache PDFBox还包括几个命令行实用程序。

从PDF文档中提取文本并生成结构化数据。

我能够成功地从pdf的所有页面中提取文本,但无法在结构化数据中生成。但无法在结构化数据中生成.指导我,如果有人来acorss这样的专业知识。代码:包pdfboxreadfromfile; ...

回答 1 投票 0

从pdf中提取段落

我正在对一本pdf电子书进行主题建模,需要逐段提取文本。为此我使用了apache pdfBox,它可以有效地从pdf中提取文本。PDFParser parser; PDFTextStripper ...

回答 1 投票 0

用PDFBox 2.0.5创建PDF按钮,在页面上显示另一个按钮。只有最后创建的一组按钮才是最有效的

这段代码的目标是在页面上有一个缩略图,当鼠标悬停在上面时,它会以全尺寸显示图像。这里的代码工作的主要注意事项是,只有最后 ...

回答 1 投票 0

PDFbox提取pdf页面和矩形的AnnotationLinks。

我必须提取PDF文件中链接的页码和坐标。我发现PDFbox可能是一个工具,我可以使用。然而,我不能找到一个例子代码正是为了这个目的。它...

回答 1 投票 2

绘制一棵树并将其打印成PDF格式 [关闭]

目前我有一个用Apache PDFBox生成的报表。我需要生成一棵树,并将这棵树作为一个页面附加到该PDF报告中。是否可以用Jtree生成一棵树并创建一个PDF?如果...

回答 1 投票 0

从1.8.x迁移到PDFBox 2.0.x [关闭]

我目前正在将我们的PDFBox依赖关系从1.8.x迁移到2.0.x,我遇到了几个错误。Error:(22, 50) java: cannot find symbol symbol: class PDRadioCollection location: package org...。

回答 1 投票 1

如何使用PDFBox使用页眉字体大小阅读PDF部分?

我正在尝试阅读PDF文档,我需要使用标题字体大小或字体和字体大小将它们按节分开,我目前已根据本文的答案将其实现。但是由于...

回答 1 投票 0

[pdfbox数字签名pdf时图像模糊

我创建了一个使用pdfbox库对pdf文件进行数字签名的实用程序,除了当...

回答 1 投票 1

C#:如何在不删除换行符的情况下删除\ r \ n除以的文本?

在此文本(来自PDFBox的PDF文本提取结果)中,我需要清除地址前面的所有内容: \ r \ n310 \ r \ n02 \ r \ nmod \ r \ nele_i \ r \ nd > \ r \ n \ r \ n \ r \ n \ ...

回答 1 投票 0

如何用Java中的PDFBox删除超链接

我正在尝试使用Java中的PDFBox从PDF中删除所有超链接。只需要纯文本。公共静态void main(String [] args)引发IOException {File pdfFile = new File(“ link ....

回答 2 投票 0

如何将通过字符串解码创建的图像插入pdfbox中的pdf

我正在尝试将图像(需要通过java.util.Base64.getDecoder()。decode(imageInputString)从字符串转换为图像)到pdf文件的特定位置。代码的主要逻辑...

回答 1 投票 0

JVM:通过三个步骤对PDF文件签名

我有一个网站,允许用户签署任何给定的上传文件。工作流程为:用户上载文件。计算文件的SHA256摘要,并将其存储在数据库中。用户签署...

回答 1 投票 0

为什么我用Apache PdfBox创建的pdf不集成新行?

我想创建多行pdf文档。我正在使用来自Apache的PdfBox。我有这个简单的代码:PDDocument document = new PDDocument(); PDPage页面=新的PDPage(); ...

回答 1 投票 0

有什么方法可以使用java [closed]在pdf中标识该段分隔的行

需要阅读pdf文档并使用Java代码标识行分隔。

回答 1 投票 0

PDFBox-签名后定义视觉签名模板

我一直在阅读官方的PDFBox示例以对PDF文档进行可视化签名,特别是CreateVisualSignature2.java中的示例,该示例生成一个空文档作为模板来定义...

回答 1 投票 0

使用PDFBox将PDF文件转换为图像

[有人可以给我一个例子,说明如何使用Apache PDFBox转换不同图像中的PDF文件(PDF的每一页一个吗?)>

回答 4 投票 53

Apache PDFBox删除字符之间的空格

我们正在使用PDFBox从PDF提取文本。某些PDF的文本无法正确提取。下图以PDF格式显示了PDF的一部分:提取文本后,我们得到以下文本:...

回答 1 投票 6

缩放后的模糊Pdf

我有一个使用Apache PdfBox开发的pdf阅读器,我的问题是缩放后我的图像模糊,即使pdf文件的分辨率非常好,这个问题也只存在于PDF中。这个...

回答 1 投票 0

pdfbox应用程序胖子给出了“无法读取JBIG2映像:未安装jbig2-imageio”,但可以从IDE正常运行

[我在构建使用pdfbox的应用程序时遇到了问题。当我从IDE运行该应用程序时,该应用程序能够读取带有jbig2图像的书籍(我使用Netbeans 8.1)(我对...

回答 1 投票 0

NiFi ExecuteScript(Groovy):使用Pdfbox从PDF中提取文本/图像:错误加载模块

NiFi 1.11.4,您好,我找到了一个有趣的解决方案,该文件可通过ExecuteScript(Groovy)从pdf文件中提取文本和图像:Cloudera文章fun nifi文章(github上的NiFi模板The ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.