所以我想使用wget从此网站下载所有mp4文件:
但是,当我尝试时,它总是下载索引文件,并且不检查网站上的任何链接。网站链接加载也大约需要几秒钟。您可以在网站上尝试。我尝试过
wget -r -l2 -nd -A'*.mp4*' https://coursevania.courses.workers.dev/[coursevania.com]Python%20for%20Data%20Science%20and%20Machine%20Learning%20Bootcamp/
老实说,我不知道我在做什么,我也已经测试了robots.txt文件并将其设置为忽略,但是它仍然返回相同的结果,下载索引文件并停止。我真的是wget的新手。
不可能。
由于wget不是javascript引擎,因此它将无法知道mp4资源的链接(除非已执行页面中的javascript)。页面源代码视图显示它完全是通过this脚本生成的。如果您确实需要递归执行此操作,则应考虑使用javascript。看看https://phantomjs.org/。