如何在Python中绕过BeautifulSoup的验证码？

Question

我想从 https:/www.example.com 使用 美丽汤 (BS4)作为

req = requests.get('https://www.example.com/')
soup = BeautifulSoup(req.text, "lxml")
cDF = soup.find('div',attrs={"id" : "nav-tabContent"}).find(
    'table',attrs={"id" : "main_table_countries_today"}).find_all('tr')

我发现一个错误

cDF = soup.find('div',attrs={"id" : "nav-tabContent"}).find(
AttributeError: 'NoneType' object has no attribute 'find'

当我调试汤汁我发现，它实际上是在显示它是被卡在了 重新验证码 的一页 Cloudflare.

我检查了其他类似的问题，而我发现大多数是零答案。有一个问题已经得到了回答（2个回答），以检查一个特定的机器人测试，这与我的查询无关。因此，我认为这个问题不能被标记为重复问题。

请告诉我，我怎样才能绕过验证码获取数据进行分析。顺便说一下，我在ubuntu的google chrome中使用privacypass。谢谢。

Answer 1

尝试改变用户代理头。例如，它与curl一起工作，所以没有任何高级保护。

Answer 2

我想你应该通过下面的链接来绕过验证码。

验证码

如何在Python中绕过BeautifulSoup的验证码？

问题描述投票：-1回答：1

1个回答

最新问题

如何在Python中绕过BeautifulSoup的验证码？

问题描述 投票：-1回答：1

1个回答

最新问题

问题描述投票：-1回答：1