如何使用Python与javascript网页交互?

问题描述 投票:0回答:2

我是网络抓取的新手;我有一个从 COCA 抓取一些数据的小项目,但我什至不知道从哪里开始。看起来这个网页是使用一些 Javascript 构建的,我想知道是否有一些包可以让我与其交互?

以下是我希望我的程序执行的一些任务:

  1. 使用自己的账户登录;
  2. 选择一个选项卡(例如搜索、图表等,请参阅COCA);
  3. 在课本中输入你要查找的单词;
  4. 抓取搜索结果。

如有任何建议,我们将不胜感激。

PS:理想情况下,一切都应该在后台运行(不会打开浏览器)。

javascript python web-scraping
2个回答
1
投票
from pyvirtualdisplay import Display
from selenium import webdriver

display = Display(visible=0, size=(800, 600))
display.start()

browser = webdriver.Firefox()
browser.get('http://www.google.com')
print browser.title
browser.quit()

display.stop()

pyvirtualdisplay
headless模式下
Display(visible=0)
需要
Xvbf
,这是Linux的一个功能。阅读更多此处有关 Xvbf 用法的信息


1
投票

正如有些人告诉您的那样,您可以使用

selenium
。 我建议您进入浏览器的开发人员工具并跟踪创建网站的网络请求,具体取决于页面的行为,也许您可以使用 python 模块
request
来模拟您看到的请求制作网站,我个人认为比较简单。 如果您无法模拟请求,请使用 selenium。

© www.soinside.com 2019 - 2024. All rights reserved.