我删除了这个问题,以抗议 Stack Overflow 与 OpenAI 的合作关系。我不同意我的写作被用来训练生成式人工智能模型。
取决于您的页面的垃圾程度,但是
/^(?:\s*<!DOCTYPE)|(?:\s*<html)/
在大多数情况下应该有效。
最简单的方法是寻找强制的
<html>
/<html[\s>])/
这足以解决您的问题吗?