如何用scrapy从html标签中提取数据?

问题描述 投票:0回答:1

我需要从这段HTML代码中提取地址信息。

     <span>
        <span class="icon"> <i class="fas fa-building"></i> </span> 8  Phạm Hùng
         Cau Giay
         Ha Noi
     </span>

我如何才能得到这些信息。如果我做一些像

response.css('div.company-info__location').get()

我回来了

<div class="company-info__location">      <span>\n        <span class="icon"> <i class="fas fa-building"></i> </span> 8  Phạm Hùng\nCau Giay\nHa Noi\n 
     </span>\n    </div>

response.css('div.company-info__location::text').get()

它只返回空格,不是我想要的。

python scrapy web-crawler
1个回答
0
投票

你可以试试 string() XPath表达式。

response.xpath('string(//div[@class="info__location"])').get()
© www.soinside.com 2019 - 2024. All rights reserved.