如何解析基于JavaScript的页面

问题描述 投票:1回答:1

我无法从使用JavaScript投放的网页上获取Ontario Coronavirus's HTML。我在Ruby中使用Nokogiri。

Ruby检索的站点更多是一个警告/说明页,该页面显示我的浏览器需要JavaScript。

<h1>JavaScript is required to view this site</h1> <p>Ontario.ca needs JavaScript to function properly and provide you with a fast,
stable experience. Please enable JavaScript or check your browser's settings.</p>...Outdated browsers lack safety features that keep your information secure

我尝试使用JSON解析页面,结果相同。该页面以stringIO对象的形式返回,并且.string也具有相同的结果。

我如何抓取此页面以及以这种方式提供服务的其他页面?我认为这是JavaScript服务的网站经常出现的问题。

javascript ruby nokogiri
1个回答
1
投票

由于它是通过ajax加载的,因此您需要为此使用Watir gem。而且,似乎他们有API,您可能还想看看它。

© www.soinside.com 2019 - 2024. All rights reserved.