Javascript 中的 Web 解析器就像 Python 中的 Beautiful Soup

问题描述 投票:0回答:1

Python 有一个名为 Beautiful Soup 的库,您可以使用它来解析 HTML 树,而无需在外部网页中创建“get”请求。我正在 JavaScript 中寻找相同的内容,但我只找到了 jsdomJSSoup (似乎未使用),如果我是正确的,它们只允许你提出请求。

我想要一个 JavaScript 库,它允许我解析整个 HTML 树而不会出现 CORS 策略错误,也就是说,无需发出请求,只需解析它。

我该怎么做?

javascript python html-parsing
1个回答
7
投票

在浏览器上下文中,您可以使用 DOMParser:

const html = "<h1>title</h1>";
const parser = new DOMParser();
const parsed = parser.parseFromString(html, "text/html");
console.log(parsed.firstChild.innerText); // "title"

在节点中你可以使用node-html-parser:

import { parse } from 'node-html-parser';

const html = "<h1>title</h1>";
const parsed = parse(html);
console.log(parsed.firstChild.innerText); // "title"
© www.soinside.com 2019 - 2024. All rights reserved.