PDFbox库页面迭代

问题描述 投票:0回答:1

我实现了一种从PDF文档中的每个PDF页面捕获特定区域的方法,因此,捕获该区域的方法采用PDPage和Rectangle对象,现在我要遍历每个页面并找到第一个String(text)位于给定的坐标处。 getPages()返回PDPageTree,所以我有点困惑,因为我无法弄清楚如何检查每个页面,因为现在它遍历每个页面。

public PDPageTree getPages() {
    return getPDDocument().getPages();
}

public String firstInvoiceNumber() throws IOException {
    Rectangle invoiceRectangle = new Rectangle(176, 176, 100, 18);
    String headerTextResult = "";
    for (PDPage pd : getPages()) {
        headerTextResult = StripByArea(pd, invoiceRectangle);
    }
    return headerTextResult;
}
java pdfbox
1个回答
1
投票
public String firstInvoiceNumber() throws IOException { Rectangle invoiceRectangle = new Rectangle(176, 176, 100, 18); String headerTextResult = ""; for (PDPage pd : getPages()) { headerTextResult = StripByArea(pd, invoiceRectangle); if(!"".equals(headerTextResult)) { break; } } return headerTextResult; }
© www.soinside.com 2019 - 2024. All rights reserved.