我试图删除屏幕截图中的每个面板,但我没有得到正确的xpath来废弃这些部分。任何人都可以帮助我。
这些数据来自对https://www.seloger.com/detail,json,caracteristique_bien.json?idannonce=142632059
的额外请求。在那里你会得到json的全部信息。
UPD:
url_id = re.search(r'/(\d+)\.htm', response.url).group(1)
details_url = 'https://www.seloger.com/detail,json,caracteristique_bien.json?idannonce={}'
# make request to url
yield Request(details_url.format(url_id))