使用Wget获取网站链接中的每个mp4文件,该文件会检查该链接中的每个链接以查找嵌入的mp4链接

问题描述 投票:1回答:1

所以我想使用wget从此网站下载所有mp4文件:

https://coursevania.courses.workers.dev/[coursevania.com]Python%20for%20Data%20Science%20and%20Machine%20Learning%20Bootcamp/

但是,当我尝试时,它总是下载索引文件,并且不检查网站上的任何链接。网站链接加载也大约需要几秒钟。您可以在网站上尝试。我尝试过

wget -r -l2 -nd -A'*.mp4*' https://coursevania.courses.workers.dev/[coursevania.com]Python%20for%20Data%20Science%20and%20Machine%20Learning%20Bootcamp/ 

老实说,我不知道我在做什么,我也已经测试了robots.txt文件并将其设置为忽略,但是它仍然返回相同的结果,下载索引文件并停止。我真的是wget的新手。

html linux wget mp4
1个回答
2
投票

不可能。

由于wget不是javascript引擎,因此它将无法知道mp4资源的链接(除非已执行页面中的javascript)。页面源代码视图显示它完全是通过this脚本生成的。如果您确实需要递归执行此操作,则应考虑使用javascript。看看https://phantomjs.org/

© www.soinside.com 2019 - 2024. All rights reserved.