网站 vermittelerregsiter.info 允许通过常规 GET 请求下载 PDF 文件: 例如。 https://www.vermittlerregister.info/recherche?a=pdf®isternummer=D-W-111-BHC1-55
我们想用 JAVA 使其自动化[用于批量加载],但我们失败了。
参见一些例如。我们尝试过的方法:
所有这些返回网页而不是 PDF 文件。
我检查过,结果是网站首先检查机器人或真实用户(浏览器)是否在请求,然后才返回 PDF:
当我尝试在浏览器(Edge 和 Chrome)中打开 PDF 链接时,
(1) 网页首先打开[并在那里检查浏览器的真实性]——我的假设。
(2) 当我再次请求相同的链接 (F5) 时,文件确实被加载。后续请求立即下载 PDF。
我们可以尝试“双击”或类似的东西吗?
检查反机器人(在 discord 服务器)已显示该网站没有这些: