我无法从使用JavaScript投放的网页上获取Ontario Coronavirus's HTML。我在Ruby中使用Nokogiri。
Ruby检索的站点更多是一个警告/说明页,该页面显示我的浏览器需要JavaScript。
<h1>JavaScript is required to view this site</h1> <p>Ontario.ca needs JavaScript to function properly and provide you with a fast,
stable experience. Please enable JavaScript or check your browser's settings.</p>...Outdated browsers lack safety features that keep your information secure
我尝试使用JSON解析页面,结果相同。该页面以stringIO
对象的形式返回,并且.string
也具有相同的结果。
我如何抓取此页面以及以这种方式提供服务的其他页面?我认为这是JavaScript服务的网站经常出现的问题。