Beautifulsoup4:当href仅提供参数时,如何从href中提取可用链接

问题描述 投票:0回答:1

我正在为荣誉项目制作一个Twitterbot,并且几乎完成了。但是,当我在网站上搜寻特定的URL时,href指向的链接看起来像这样:

?dmy&urile = wcm%3apath%3a%2Fohio%2Bcontent%2Benglish%2Fcovid-19%2Fresources%2Fnews-releases-news-you-use-use-%% 2Fnew-restartohio-opening-dates

检查html并将鼠标悬停在上方的href内容上时,它表明以上内容实际上是链接的尾端。有什么方法可以将这些数据转换成可用的链接?同一轮回旋中的其他链接在同一网站上提供了完整的链接,因此我不确定为什么这与其他链接有所不同。

我曾尝试搜索该问题的答案,但很短:很抱歉,如果这是重复的话。

python web-scraping beautifulsoup href
1个回答
0
投票

BeautifulSoup向您显示页面的HTML内容。如果链接是相对的,则需要页面的基本URL。那应该返回您的请求结果中,而不是HTML本身。

© www.soinside.com 2019 - 2024. All rights reserved.