从javascript内部提取href

问题描述 投票:0回答:1

我有一个要使用BeautifulSoup4提取的链接。使用Chrome开发人员工具,我可以识别要搜索的内容,但是bs4仅返回find_all的空白列表。

    <div class="many-div-levels">
      <div class="js-container">
        <div class="more-div-levels">
          <a rel="noopener noreferrer" title class="another-class" href="i-want-this-link.com">LINK</a>
        </div>
      </div>
    </div>

我正在尝试从hemnet.se的物业列表中提取图像。我没有给出完整的示例,而是想表明html是许多嵌套的div,然后是js类,然后又是嵌套的div类。我假设js-container表示它是一个javascript(在有帮助的情况下,可以使用图库轮播),并且这以某种方式阻止了我访问href。但是后来我不明白为什么我可以在Developer Tools

中看到它

保持健康!

python html beautifulsoup web-crawler href
1个回答
0
投票

在开发人员工具中,您将看到所有内容,无论实际完成隐藏或可见内容的方式如何>>

这意味着当您右键单击并检查标记时,您可以通过开发人员工具修改,删除甚至将多余的HTML添加到现有页面中>]

虽然违反了网站的政策,但是从技术上讲,您甚至可以通过开发人员工具执行随机JavaScript。

© www.soinside.com 2019 - 2024. All rights reserved.