我想废弃标签内的文本,但是HTML文档中的文本,已经下降了一行

问题描述 投票:0回答:1

我想使用 scrapy 库从 span 标签中读取一个单词。问题是我看不懂这个词。在输出中,它只给出了表达式“ ”.

HTML 标签:

<span class="item">
   <svg width="" height="">
   </svg>
   "1500 KM"
</span>

我想读1500公里。

我试过这个:

import scrapy
fetch("example.com")
response.css("span.item::text").get()

or : response.css("span.item::text")

output: "\n"

我也使用了 strip() 但它不起作用。

python web-scraping scrapy
1个回答
0
投票

无论您从哪个

example.come
网站获取此内容,但要从特定标签中提取文本,您提取的内容都是错误的。

您的

response.css
在这里所做的是提取
span.item
的直接子级。相反,使用
xpath
方法并给出这样的参数来提取
<svg>
标签的兄弟。

response.xpath("//span[@class='item']/text()[2]").get().strip()

这会将文本作为输出。

© www.soinside.com 2019 - 2024. All rights reserved.