使用Beautifulsoup查找特定ID下的文章

问题描述 投票:0回答:2

Here is a screenshot of the section I want to web scrape, I took a screenshot because I just wanted to give an overall picture

我正在尝试通过网络抓取BBC网站的特定部分,这是最新的更新部分。看起来像这样enter image description here

不确定在Beautifulsoup中为findAll放置什么。使用我已经掌握的知识,我尝试了bsObj.findAll(id="latest-updates"),但那当然是行不通的。如果有人需要最新更新的链接,它将在此处https://www.bbc.co.uk/news/uk,向下滚动将显示您的最新更新

我正在尝试寻找一种通过使用id获取最新更新部分中所有链接的方法吗?如果正确的方法是使用id = latest-updates,有人可以指出我做错了什么吗?否则,如果Im完全错误,请告诉我应该在哪个特定的类,id或div上找到我应该在此特定最新更新下找到的链接寻找。抱歉,如果这不是一个特定的问题,并且感谢您对问题的任何帮助

python beautifulsoup screen-scraping
2个回答
0
投票

尝试bsObj.findAll(attrs={"id":"latest-updates"})


0
投票

[如果您正在寻找最新更新的标题的链接,我认为您应该搜索“ a”和标题的类别。如果我没看错,这应该是正确的findAll:

© www.soinside.com 2019 - 2024. All rights reserved.