Python 有一个名为 Beautiful Soup 的库,您可以使用它来解析 HTML 树,而无需在外部网页中创建“get”请求。我正在 JavaScript 中寻找相同的内容,但我只找到了 jsdom 和 JSSoup (似乎未使用),如果我是正确的,它们只允许你提出请求。
我想要一个 JavaScript 库,它允许我解析整个 HTML 树而不会出现 CORS 策略错误,也就是说,无需发出请求,只需解析它。
我该怎么做?
在浏览器上下文中,您可以使用 DOMParser:
const html = "<h1>title</h1>";
const parser = new DOMParser();
const parsed = parser.parseFromString(html, "text/html");
console.log(parsed.firstChild.innerText); // "title"
在节点中你可以使用node-html-parser:
import { parse } from 'node-html-parser';
const html = "<h1>title</h1>";
const parsed = parse(html);
console.log(parsed.firstChild.innerText); // "title"