如何绕过“无头”reCaptcha V2?

问题描述 投票:0回答:1

我正在使用 requests、BeautifulSoup 和可能的 Twill 创建一个机器人。该机器人将抓取大量论坛并从中收集数据。然而,我目前正在工作的论坛(https://wearedevs.net/)在其登录页面上使用了reCaptcha V2,因此机器人无法登录。我在尝试通过代码登录后发现了这一点,而是返回有效响应并重新加载页面时,我会不断收到 404 错误。我以为这是我的代码错误,但即使尝试 Twill 时它仍然无法登录。

我需要能够通过该网站登录,以便我可以访问访客用户无法访问的功能。

我知道该网站有 reCaptcha,所以我研究了 reCaptcha 旁路,问题是它不是视觉 reCaptcha,而是“无头”版本。如下图:

页面右下角:

换句话说,reCaptcha 不会向您提供验证码提示,而是分析您在网站上的行为并确定您是否是机器人。

我怀疑 404 是因为 reCaptcha 确定请求是机器人。因此,我尝试的第二件事是从代码向站点 API 发送直接 POST 请求,如下所示:

https://wearedevs.net/api/v1/account/login

以及所需的 JSON 数据,其格式如下:

{“g-recaptcha-response”:“recaptcha-response-here”,“用户名”:“example_username”,“密码”:“example_password”,“token2fa”:“”}

我没有有效的 reCaptcha 响应发送到服务器,因此我尝试从 JSON 数据中排除该响应,但是,虽然请求成功,但服务器发回了一条错误,指出登录失败,因为 reCaptcha 响应不是存在。

然后我尝试使用 BeautifulSoup 向登录页面发送请求,获取 reCaptcha 响应,然后将其包含在要发送的 JSON 数据中,但我无法使用 BeautifulSoup 获取 reCaptcha 响应。

我已经尝试过 Selenium,但我目前在没有浏览器的环境中工作,因此 Selenium 无法工作,因此不是一个选项。

如果有人有任何方法可以绕过或验证无头 reCaptcha V2,请分享,我将不胜感激。谢谢!

python authentication web-scraping bots recaptcha
1个回答
0
投票

这个问题你解决了吗?

这个问题是我刚刚遇到的,现在正在尝试找到解决方案。

© www.soinside.com 2019 - 2024. All rights reserved.