我有一个要使用BeautifulSoup4提取的链接。使用Chrome开发人员工具,我可以识别要搜索的内容,但是bs4仅返回find_all
的空白列表。
<div class="many-div-levels">
<div class="js-container">
<div class="more-div-levels">
<a rel="noopener noreferrer" title class="another-class" href="i-want-this-link.com">LINK</a>
</div>
</div>
</div>
我正在尝试从hemnet.se
的物业列表中提取图像。我没有给出完整的示例,而是想表明html是许多嵌套的div
,然后是js
类,然后又是嵌套的div
类。我假设js-container
表示它是一个javascript(在有帮助的情况下,可以使用图库轮播),并且这以某种方式阻止了我访问href。但是后来我不明白为什么我可以在Developer Tools
保持健康!
在开发人员工具中,您将看到所有内容,无论实际完成隐藏或可见内容的方式如何>>
这意味着当您右键单击并检查标记时,您可以通过开发人员工具修改,删除甚至将多余的HTML添加到现有页面中>]
虽然违反了网站的政策,但是从技术上讲,您甚至可以通过开发人员工具执行随机JavaScript。