PDFBox:分割pdf和输出前缀

问题描述 投票:0回答:2

我喜欢使用PDFBox从大PDF中提取单个页面。我所有的“真实” PDF文件都位于一个目录中。因此,如果我提取一页,我想将此页保存到另一页的目录中。 (或将其传送到标准输出)

问题:有没有一种方法来定义输出目录或输出前缀,例如-prefix=/tmp/pdf-snipped-

带有选项PDFSplit的PDFBox接缝可将拆分的页面存储在与源pdf相同的目录中。但这不是很好。

顺便说一句,在拆分之前,不能复制源pdf,因为其中很大(超过1 GB)

split filenames option prefix pdfbox
2个回答
1
投票

回答我自己的问题:

看起来,没有选择(也没有隐藏的)来定义输出前缀或输出文件名。

因此,我决定下载并更改PDFbox源代码,并添加了一个新选项(“前缀”)来定义存储已截取的PDF的路径或定义输出名称。

如果您有同样的问题,那么这就是我要走的路:

1。从svn下载源:http://pdfbox.apache.org/downloads.html#scm并根据需要在此文件中更改代码:

{PDFBOX-source-root}/pdfbox/src/main/java/org/apache/pdfbox/PDFSplit.java

2。使用maven构建自己的PDFBox版本:http://pdfbox.apache.org/building.html


0
投票

选项-outputPrefix可用于定义要保存输出的位置。

© www.soinside.com 2019 - 2024. All rights reserved.