让Nokogiri决定是否使用#fragment或#parse

问题描述 投票:0回答:2

我删除了这个问题,以抗议 Stack Overflow 与 OpenAI 的合作关系。我不同意我的写作被用来训练生成式人工智能模型。

ruby xml nokogiri
2个回答
2
投票

取决于您的页面的垃圾程度,但是

/^(?:\s*<!DOCTYPE)|(?:\s*<html)/

在大多数情况下应该有效。


0
投票

最简单的方法是寻找强制的

<html>
标签,例如使用正则表达式
/<html[\s>])/
(允许属性)。

这足以解决您的问题吗?

© www.soinside.com 2019 - 2024. All rights reserved.