如何在Python中绕过BeautifulSoup的验证码?

问题描述 投票:-1回答:1

我想从 https:/www.example.com 使用 美丽汤 (BS4)作为

req = requests.get('https://www.example.com/')
soup = BeautifulSoup(req.text, "lxml")
cDF = soup.find('div',attrs={"id" : "nav-tabContent"}).find(
    'table',attrs={"id" : "main_table_countries_today"}).find_all('tr')

我发现一个错误

cDF = soup.find('div',attrs={"id" : "nav-tabContent"}).find(
AttributeError: 'NoneType' object has no attribute 'find'

当我调试 汤汁我发现,它实际上是在显示它是被卡在了 重新验证码 的一页 Cloudflare.

我检查了其他类似的问题,而我发现大多数是零答案。有一个问题已经得到了回答(2个回答),以检查一个特定的机器人测试,这与我的查询无关。因此,我认为这个问题不能被标记为重复问题。

请告诉我,我怎样才能绕过验证码获取数据进行分析。顺便说一下,我在ubuntu的google chrome中使用privacypass。谢谢。

python beautifulsoup recaptcha
1个回答
0
投票

尝试改变用户代理头。例如,它与curl一起工作,所以没有任何高级保护。


0
投票

我想你应该通过下面的链接来绕过验证码。

验证码

© www.soinside.com 2019 - 2024. All rights reserved.