复制网站以供不使用JavaScript的离线视图(html和.js外部的脚本标签)

问题描述 投票:-3回答:1

我正在尝试复制网站以供离线查看,而没有任何依赖关系。

我想复制不带SCRIPT标签(特别是javascript)和不带外部脚本(.js)的HTML。

[曾尝试使用WGET --ignore-tags和HTTrack进行此操作,但未按预期工作。脚本被整体复制。

javascript html wget httrack
1个回答
0
投票

例如,在Headless mode中调用Chrome chrome --headless --disable-gpu --dump-dom https://www.chromestatus.com/将转储呈现的DOM的HTML,而不包含任何JavaScript。

[This post描述了如何使用Headless Chrome和Puppeteer构建爬虫。

© www.soinside.com 2019 - 2024. All rights reserved.