我正在尝试做一个网络抓取项目。我使用网站的精简版来简化我的工作,但图片中突出显示的元素没有任何标记。我无法列出比赛参与者,因为如果在bs4中使用#soup.find(id =“ score-data”)。text函数,我可以获得所有文本,但我只需要参与者。 html of the website
一种选择是尝试遍历span元素,然后尝试获取下一个同级。
我尚未对其进行测试,但是代码应类似于:
for span in soup.find(id="score-data").find_all('span'):
print(span.next_siblings)