为什么python抓取结果与浏览器不同

问题描述投票：0回答：1

我可以在浏览器中浏览页面https://www.xiami.com/artist/O9fc383，但是当我通过chrome驱动程序解析它时，我得到了不同的源代码，因此我无法抓取该页面，我该怎么办？浏览器中没有此源表单。

...
<form action="//www.xiami.com:443/artist/O9fc383/_____tmd_____/verify/" id="nc-verify-form" method="GET">
...
<script>
    var referrer=document.referrer;
    if (referrer && referrer.indexOf("__tmd__")===-1 ){
        localStorage.x5referer = document.referrer;
    }else{
        localStorage.x5referer = window.location.href;
    }
</script>

python web-scraping beautifulsoup selenium-chromedriver referrer

1个回答

0
投票

你用什么lib来刮？如果你使用美丽的汤或urllib你不能刮掉javascript生成的代码。你将不得不使用像silenium Scraping a JS-Rendered Page这样的东西

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.