如何使用Selenium获取Opta数据?

问题描述 投票:0回答:1

我正在尝试从足球比赛中获取 Opta 事件数据。它有一个链接地址,但当尝试访问它时,我只收到 10300 错误代码。

我可以查看数据的唯一位置是开发工具中的“源”下,位于名为 api.performfeeds.com 的文件夹下。如何使用 selenium 访问源?

我尝试过 api 请求和许多其他东西。我可以抓取大多数其他数据网站,但这个(scoresway.com)很棘手。

python selenium-webdriver web-scraping
1个回答
0
投票

要使用 Selenium 从足球比赛中抓取 Opta 事件数据,您可以按照以下步骤操作:

  1. 检查网络请求:使用浏览器的开发人员工具检查网络请求并找到 Opta 事件数据请求。
  2. 识别 API 端点:查找用于获取 Opta 事件数据的 API 端点。该端点将位于开发人员工具中的“源”选项卡下,可能位于名为“api.performfeeds.com”的文件夹下。
  3. 使用 Selenium 访问 API 端点:使用 Selenium 打开包含 Opta 事件数据的网站,然后导航到开发人员工具中的“源”选项卡。您可以通过使用 Selenium 以编程方式打开开发人员工具来实现此目的。
  4. 从 API 响应中提取数据:使用 Selenium 访问 API 端点后,您可以从 API 响应中提取 Opta 事件数据。您可以使用 Python 的 requests 库或 Selenium 的内置方法来发出请求并检索数据。

以下是如何使用 Selenium 访问“源”选项卡并从 API 端点提取数据的基本示例:

from selenium import webdriver

# Initialize Selenium WebDriver
driver = webdriver.Chrome()

# Open the website containing the Opta event data
driver.get("URL_OF_THE_WEBSITE")

# Navigate to the 'Sources' tab in the developer tools
driver.execute_script("window.open('chrome-devtools://devtools/bundled/inspector.html')")
dev_tools_window = driver.window_handles[-1]
driver.switch_to.window(dev_tools_window)

# Now you should be in the 'Sources' tab. Locate the API endpoint and extract the data.
# You can use Selenium's find_element_* methods to locate elements on the page and retrieve the API endpoint.

# Once you have the API endpoint, you can use Python's requests library to make the request and retrieve the data.

# Don't forget to close the WebDriver once you're done
driver.quit()

请记住将 URL_OF_THE_WEBSITE 替换为包含 Opta 事件数据的网站的实际 URL。

© www.soinside.com 2019 - 2024. All rights reserved.