在HTML中我如何到达不在标记中的文本元素?

问题描述 投票:-1回答:1

我正在尝试做一个网络抓取项目。我使用网站的精简版来简化我的工作,但图片中突出显示的元素没有任何标记。我无法列出比赛参与者,因为如果在bs4中使用#soup.find(id =“ score-data”)。text函数,我可以获得所有文本,但我只需要参与者。 html of the website

html web web-scraping tags screen-scraping
1个回答
0
投票

一种选择是尝试遍历span元素,然后尝试获取下一个同级。

我尚未对其进行测试,但是代码应类似于:

for span in soup.find(id="score-data").find_all('span'):
    print(span.next_siblings)
© www.soinside.com 2019 - 2024. All rights reserved.