如何从scrapy中的选择器中提取p标签内的内部文本

问题描述 投票:0回答:1

我使用 css 选择器来检索 p 标签,并且尝试从第一个 p 标签中提取文本。但它始终是包含 p 标签的 html 内容。 这是我的代码。

section_div = response.css('div[data-testid="talent-profile-page-talent-info"]')
p_names = section_div.css("section#talent-summary >p")
name = p_names[0].extract()

这是 p 标签 html:

<p color="inherit" class="Text-sc-1d6qffq-0 eBczUW">Bob Guiney</p>

当然,我知道还有其他方法可以获取内部文本,但我想以这种方式完成。

有什么函数可以只从选择器中获取内部文本吗?我只需要 Bob Guiney

python scrapy
1个回答
0
投票

要选择内部文本,您可以使用

::text
伪元素。

因此您必须将代码更新为

p_names = section_div.css("section#talent-summary > p::text")

这将从 p 标签中提取文本内容。

© www.soinside.com 2019 - 2024. All rights reserved.