对于文档中的某些区域,在jsoup中选择性停用漂亮打印

问题描述 投票:0回答:1

使用jsoup清理HTML文档时,我喜欢它会自动应用漂亮的印刷的事实。我知道我可以在每个文档的基础上停用它,但是我喜欢将它应用于大多数文档,除了某些有问题的区域(在这些区域中jsoup做得不好)。

[一个例子是DIV标签,CSS指定white-space: pre-wrap;,即从语义上讲,它们的行为类似于PRE标签,这意味着浏览器将对换行符和其他空格(缩进)敏感。如果在这些区域内有更多标签,例如BRSPAN等,则会变得更糟,因为应用了漂亮的打印并破坏了这些区域的预期格式。

因此,我不想在整个HTML文档中完全取消漂亮的打印效果,而是希望在解析器遇到类似div.listing之类的东西时(有的,我知道有问题的区域的CSS类名)有选择地取消激活它,并保留原始HTML那里。我将如何实施呢?

更新:

我忘了提到我使用打印清理过的文档。
output.print(document);

其中outputPrintStreamdocument是jsoup Document实例。因此,如果有更好的输出文档的方法,我也欢迎您提出建议。

[使用jsoup清理HTML文档时,我喜欢它会自动应用漂亮的印刷的事实。我知道我可以在每个文档的基础上停用它,但是我希望将其应用于大多数...

jsoup pretty-print
1个回答
0
投票

我最终做的是因为到目前为止我在这里没有答案,也没有找到更好的解决方案,这很可怕,但是它有效:

© www.soinside.com 2019 - 2024. All rights reserved.