我想下载“Oblivion:Oblivion-UESP wiki”的 wiki 页面,但不获取其他 wiki 内容的侧边栏链接

问题描述 投票:0回答:1

我尝试使用 wget 下载“Oblivion:Oblivion-uesp wiki”“https://en.uesp.net/wiki/Oblivion:Oblivion”,这是关于 crpg 游戏“Oblivion”的。这个游戏已经很老了,我担心有一天维基会消失。它包含大量信息,单独处理每个页面非常困难,当然这些页面不会在脱机副本中链接。由于侧栏链接,wget 也开始下载其他内容。是否可以在没有侧边栏链接的情况下访问主页及其链接?所有链接的页面也都有侧边栏。

我只是尝试使用 wget 下载 wiki 。它开始下载侧边栏链接的其他内容。我搜索了 Firefox 扩展,但找不到任何合适的东西。

recursion firefox download wget sidebar
1个回答
0
投票

遗忘:遗忘-uesp wiki

我调查了该网站并得出结论,与《Oblivion》游戏相关的内容在网址中的某处有

blivion
,例如
https://en.uesp.net/wiki/Oblivion:Alchemy
因此可以使用
--accept-regex ulregex
选项来充分确定要下载的内容,我建议遵循命令

wget -r --accept-regex ".*blivion.*" "https://en.uesp.net/wiki/Oblivion:Oblivion"

请自己测试一下,如果能获取到你想要的东西,就写下来,不要有太多垃圾。请记住,如果子字符串

blivion
存在于 url 中,则它可能会获取与遗忘(游戏)无关的内容,例如你可能会在另一款游戏中咒语“该死的其余遗忘”,但希望误报率应该较低。

© www.soinside.com 2019 - 2024. All rights reserved.