我使用 css 选择器来检索 p 标签,并且尝试从第一个 p 标签中提取文本。但它始终是包含 p 标签的 html 内容。 这是我的代码。
section_div = response.css('div[data-testid="talent-profile-page-talent-info"]')
p_names = section_div.css("section#talent-summary >p")
name = p_names[0].extract()
这是 p 标签 html:
<p color="inherit" class="Text-sc-1d6qffq-0 eBczUW">Bob Guiney</p>
当然,我知道还有其他方法可以获取内部文本,但我想以这种方式完成。
有什么函数可以只从选择器中获取内部文本吗?我只需要 Bob Guiney
要选择内部文本,您可以使用
::text
伪元素。
因此您必须将代码更新为
p_names = section_div.css("section#talent-summary > p::text")
这将从 p 标签中提取文本内容。