无法获得正确的标头功能(403错误)

问题描述 投票:0回答:1

我一直在关注YouTube上的指南,但仍然坚持让正确的用户代理通过HTTP 403 Forbidden

这是我正在尝试的代码:

from bs4 import BeautifulSoup as soup
from urllib.request import urlopen as uReq

user_agent = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7'

my_url = "https://www.pedidosya.com.ar/restaurantes/buenos-aires/monserrat/empanadas-delivery"
headers = {'User-Agent':user_agent,} 

uReq(my_url)
python beautifulsoup http-status-code-403
1个回答
1
投票

也许这是一个问题,即不保持与保存像cookie这样的数据的服务器的会话?我遇到了重定向超时的问题,解决方案是使用requests.session()。我的代码最终看起来像:

import bs4
import requests

s = requests.session()
s.headers['User-Agent'] = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.131 Safari/537.36'
res = s.get('https://www.pedidosya.com.ar/restaurantes/buenos-aires/monserrat/empanadas-delivery')
soup = bs4.BeautifulSoup(res.text, 'html.parser')

当我运行它时似乎没有错误。

我刚在网上找到的用户代理。我不知道它是如何工作的,但它使我的脚本工作,所以我不必理解XD

© www.soinside.com 2019 - 2024. All rights reserved.