如果我有网址列表,如何将多个页面下载为 pdf?

问题描述 投票:0回答:1

我想将大量网页(尤其是由文本行和偶尔的图像组成)下载为 PDF,但手动执行有点太多了。 url 本身可以轻松迭代,因为它们的形式为“https://www.(site).com/(stuff)/(number) (站点)和(东西)是静态的,而数量会变化。 有没有办法使用 chrome 标准打印为 PDF 或任何其他方法下载从 n 到 m 的所有网站。 我试着在互联网上查了一下,但我并没有找到太多有帮助的东西。 我可以用 python、c、css 和 HTML 编写一些代码,但如果我需要另一种编码语言,我准备学习它。 P.S:如果这篇文章有点枯燥,我很抱歉,但这是我的第一篇文章,我不知道该写什么。 预先感谢!

pdf url automation download iteration
1个回答
0
投票

您的答案基于您指定的编程

https://www.(site).com/(stuff)/(number)
其中(站点)和(东西)是固定的,因此只有数字发生变化

就像 1 2 3 一样简单,只需在 shell 中创建循环,然后调用浏览器

我使用的是 Windows,因此我的 chrome 是 MSEdge 的别名,但它们在相同的编程代码库上工作。我已允许包含标题,但关闭方式有所不同,您需要通过浏览器命令级别进行结账。

for /l %i in (1,1,3) do @%chrome% --headless --print-to-pdf=%cd%\%i.pdf https://www.example.com/stuff/%i
© www.soinside.com 2019 - 2024. All rights reserved.