市场上有许多转换器可以从简单的HTML / CSS页面创建和操作PDF文件。这些工具非常便于快速创建一些漂亮的PDF文件,而无需使用这个世界上更复杂的报告工具。
我正在使用Winnovative软件来实现这一目标,但我想知道如何创建可访问文件(标记为PDF)以改进文本到语音工具处理。
是否存在可用于实现此目的的HTML标记?有人对这种要求有一些经验吗?
该工具本身必须能够支持pdf / ua规范(标记为pdf)。可能的PDF标签列表很好地与html标签相对应。例如,有<h1>
通过<h6>
标签,表标签(<table>, <th>, <tr>, <td>
),列表标签(<l>, <li>
),等等。
有一些细微的差别,比如开始列表的标签是<l>
而不是html的<ul>
或<ol>
。使用PDF文档,屏幕阅读器将显示“列出3项”,然后浏览每个项目。它似乎并不关心它是否是项目符号或编号,因此pdf / ua有<l>
和html的原因有<ol>
和<ul>
。
无论如何,关键是你不需要使用任何特殊的html标签来生成标记的pdf。生成pdf的工具只需要支持pdf / ua。我在Winnovative的网站上没有看到任何表明支持它的内容。
仅供参考,以下是PDF / UA中提供的标签
<Art>
<Annot>
<BibEntry>
<BlockQuote>
<Caption>
<Code>
<Div>
<Document>
<Figure>
<Form>
<Formula>
<H>
<H1>
<H2>
<H3>
<H4>
<H5>
<H6>
<Index>
<Lbl>
<Link>
<L>
<LI>
<Lbody>
<Note>
<P>
<Part>
<Quote>
<Reference>
<Sect>
<Span>
<Table>
<TD>
<TH>
<TOC>
<TOCI>
<TR>
Essential PDF支持在使用Internet Explorer MSHTML引擎从HTML转换为PDF时生成带标记的PDF。
注意:我为Syncfusion工作。
关于标记PDF的棘手问题的良好解释。在研究项目的可访问PDF输出时,我发现PDFReactor(www.pdfreactor.com)可以做到这一点。不幸的是,目前这个项目的许可证没有预算,所以我没有在生产中测试它,但是尝试了免费的个人版本并获得了令人满意的结果。