我学习本教程是因为我想学习网络抓取。 https://www.datacamp.com/tutorial/making-web-crawlers-scrapy-python
当我开始使用 CSS 选择器进行提取时,我键入了以下代码:
response.css(".product::text").extract_first()
正如教程告诉我的那样。
我没有得到响应对象,而是收到了空白输出。
出了什么问题?预先感谢!
我也尝试打印它,但输出为“无”。
print(response.css(".product::text").extract_first())
这可能只是一个过时的教程(因为它使用
extract_first
)。教程中的选择器不再正确。
您需要找到正确的选择器(像教程一样使用浏览器的开发工具),例如:
In [6]: response.css(".card--out-wrapper h3::text").get()
Out[6]: 'Magcubic-Projetor de Cinema Portátil, 4K, Android 11, 1080P nativo, 390ANSI, HY320, Dual Wifi6, BT5.0, 1920*1080P, importado, HY300'