我正在使用 beautifulsoup 查找与静态相关的所有元素。
所有与静态相关的标签和元素的列表是什么?
除了通过多个具有不同参数的
BeautifulSoup.findAll()
查找之外,还有其他方法吗?
我目前最好的版本看起来像
stitic_ = souped.findAll('link', rel='stylesheet') + \
souped.findAll('img') + \
souped.findAll('script') + \
souped.findAll('video')
如果这是正确的,也许有一些我通过的元素。
注意: 在较新的代码中避免使用旧语法
findAll()
而是使用 find_all()
或 select()
- 如需了解更多信息,请花一分钟时间检查文档
soup.select('img, script, video')