pdfbox 相关问题

Apache PDFBox库是一个用于处理PDF文档的开源Java工具。该项目允许创建新的PDF文档,处理现有文档以及从文档中提取内容的功能。 Apache PDFBox还包括几个命令行实用程序。

检测PDF中丢失/损坏的Unicode映射

从一些PDF中提取文本时,PDFBox会返回乱码。这是因为Unicode映射丢失或损坏。我可以在控制台上看到以下警告。我希望能够发现这个......

回答 2 投票 3

通过页面搜索已用资源并将其删除

我使用这种技术将acroform从另一个源pdf导出到新的pdf文件。结果pdf with acroform只有你可以在这里下载我用pdfcompressor在线网站来压缩这个pdf(...

回答 1 投票 0

删除pdf中的acroform

我使用removeField删除文档的字段但如何删除pdf中的completly acroform?我知道acroform.flatten()但我不知道这是否是删除所有acroform的正确方法...

回答 1 投票 1

PDFBox - “没有主要的清单属性”

我试图在powershell中运行pdfbox,但我只是得到错误:java -jar。\ pdfbox-2.0.14.jar ExtractText'。\ TEST.PDF'out.txt pdfbox-2.0.14中没有主要清单属性.jar与pdfbox -...相同

回答 1 投票 0

如何使用Apache PDFBox从PDF文件中提取文本

我想用Apache PDFBox从给定的PDF文件中提取文本。我写了这段代码:PDFTextStripper pdfStripper = null; PDDocument pdDoc = null; COSDocument cosDoc = null;文件文件=新文件(...

回答 5 投票 25

pdfbox:...在此字体的编码中不可用

我在使用pdfbox 2.0.2从先前阅读的文档(https://www.dropbox.com/s/ttxiv0dq3abh5kj/Test.pdf?dl=0)的元素编写pdf文档时遇到问题。一切正常,除非我......

回答 1 投票 5

PDFBox错误:“找不到org.apache.pdfbox.rendering.PDFRenderer”

我正在为Bitbucket Server编写一个插件,我必须处理将PDF渲染到图像。我为此目的使用PDFBox。我有一个pdfToPng方法,将被调用来进行处理和...

回答 1 投票 1

为什么pdf只包含一个字段大约500Kb

在这里你可以下载pdf与一个acroform字段,他的大小正好是427Kb如果我删除这个独特的字段,文件只有3Kb,为什么会发生这种情况?我尝试使用PDF调试器和...进行分析

回答 1 投票 0

PDFBox API:如何更改字体以处理AcroForm字段中的西里尔文值

我需要帮助使用PDFBox API将Cyrillic值添加到字段中。这是我到目前为止:PDDocument document = PDDocument.load(file); PDDocumentCatalog dc = document.getDocumentCatalog(); ...

回答 1 投票 2

找不到PDF格式的所有字段(acroform)

考虑这个pdf使用此代码我除了检索所有字段,但我得到其中一半:pdfOriginal.getDocumentCatalog()。getAcroForm()。getFields()。forEach(field - > {System.out.println(field ....

回答 1 投票 1

PDFBox IO异常:COSStream已关闭且无法读取

我正在使用PDFBox在Java中编写一些代码。我正在尝试使用从Excel电子表格中读取的值来填充具有特定表单的PDF。下面是我的班级文件。 ...

回答 1 投票 2

深度克隆PDPage的正确方法是什么?

我正在使用PDFBOX v2,我正在尝试克隆PDDocument的第一个PDPage,以便将其作为新PDPage的模板。第一页,有一些我需要填写的acroform字段。我试过一些......

回答 1 投票 0

如何(水平)对齐PDFBox中的PDTextField文本?

我有一个程序在PDF文件中创建TextFields,因此它可以用作表单。我希望我在我创建的TextFields中编写的文本能够居中。怎么可能? ...

回答 1 投票 2

无法在PDF中保存阿拉伯语单词 - PDFBox Java

尝试在可编辑的PDF中保存阿拉伯语单词。它适用于英语,但是当我使用阿拉伯语单词时,我得到了这个异常:java.lang.IllegalArgumentException:U + 0627不是......

回答 2 投票 6

如何使用java获取pdf中任何给定单词的(x,y宽度高度)

我需要在pdf中获取给定单词的x,y,宽度和高度。以便稍后在解析相同类型的文件时,我可以从坐标本身获取值。我应该如何获得一个单词的位置......

回答 1 投票 0

使用PDFbox确定文档中单词的坐标

我正在使用PDFbox提取PDF文档中单词/字符串的坐标,并且到目前为止已成功确定单个字符的位置。这是迄今为止的代码,来自......

回答 4 投票 16

如何使用裁剪打印机的硬边距而不是移位来打印PDF?

我正在尝试在特殊类型的纸张上打印PDF,其中内容的位置很重要,并且不允许移位。我正在使用java.awt.print.PrinterJob和org.apache.pdfbox.printing.PDFPrintable:...

回答 1 投票 0

获取PDPage / PDDocument的DPI以准确计算PDF尺寸

我希望得到一个PDF格式的每个页面的准确大小,作为我将要创建的PDF单元测试的一部分。因为我正在处理每个文档中有许多不同页面大小的PDF代码......

回答 1 投票 0

如何使用PDFBox 2和Boxable创建内部表?

我正在使用PDFBox v2和boxable,我需要生成一个内部有2行的单元格。我尝试像维基解释,但在我的应用程序单元格内容打印字面。生成内部的代码......

回答 1 投票 1

Lucene for Java with PDFBox获得nullpointer异常

MEANWHILE我解决了它。看下面的解决方案。嘿,我对PDFBox API感到沮丧。我做了:PDDocument pdfDocument = PDDocument.load(new File(“text.pdf”)); PDFTextStripper stripper = ...

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.