页脚中写入的 PDF 页面

问题描述 投票:0回答:1

有人知道 acrobat reader 如何知道我当前正在查看的页面吗? 例如 - 我有一个 PDF 文件,其中页脚中包含页码,格式为 - 1/A 或 1/1 - 分为章节,acrobat 知道这是页数 - 它不只写从开始到结束的总页数当前页面。

我正在编写 C# 应用程序 WinForms,我需要获取页数 - 与 acrobat 的方式相同。 我使用 pdfLibView lib 将每个页面转换为文本,但是随后,我需要查看最后一页并使用复杂的算法来找出页脚中的哪个字符串是页码 - 它可以包含任何其他信息。

那么,您知道如何获取本页上所写格式的页码吗?

c# pdf numbers
1个回答
1
投票

您的文档似乎使用了 PDF 规范中定义的页面标签功能。

8.3.1 页面标签说:

此外,文档可以选择定义页面标签(PDF 1.3)以 在屏幕上或打印中直观地识别每一页。页面标签和 页面索引不需要重合:索引是固定的,正在运行 从第一页的 0 开始连续浏览文档, 但标签可以以任何适合的方式指定 特定文件。例如,如果文档以 12 页开头 前面的内容用罗马数字编号,其余部分用罗马数字编号 文档以阿拉伯语编号,第一页有页面索引 为 0 且页面标签为 i,第十二页的索引为 11 且 标签 xii,第 13 页将具有索引 12 和标签 1。

如果您想访问现有文档中的页面标签信息,您可以尝试Docotic.Pdf库(免责声明:我为库的供应商工作)。

这里是如何将页面标签添加到 PDF 文档的示例。此示例不展示如何访问现有标签,但可能会提供一些开始的线索。

© www.soinside.com 2019 - 2024. All rights reserved.