我如何使用请求获取网站html代码?

问题描述 投票:0回答:1

我重复了教程中的所有步骤,但我没有得到代码。虽然几天前一切正常

我写了一个简单的代码:

import requests
url = 'https://i-teka.kz/almaty/spisokaptek'
page = requests.get(url)
print(page.text)

运行后我得到:

<html>
<head><title>403 Forbidden</title></head>
<body bgcolor="white">
<center><h1>403 Forbidden</h1></center>
<hr><center>nginx</center>
</body>
</html>

但应该获得完整的 html 代码 我不明白问题是什么

python web-scraping html-parsing
1个回答
0
投票

可能正在检查各种标头。您可以尝试各种标头并找到所需的标头。

有一个名为 requestez 的库,它简化了这一切并自动完成。 你可以做

pip install requestez

然后

import requestez
url = 'https://i-teka.kz/almaty/spisokaptek'
page = requestez.Session().get(url)
print(page)

© www.soinside.com 2019 - 2024. All rights reserved.