在R中废弃tbody类对象>>

问题描述 投票:1回答:2

我对使用R进行网页剪贴完全陌生,我想剪贴一下表现为tbody的下表(图片)。如果运行以下代码,则只会看到标题,而没有数据(捷克语网站)。

我应该在该处获得下订单的时间,价格,数量和克朗价格。

library(rvest)
library(dplyr)

PSE_Page <- "https://www.pse.cz/detail/CZ0003519753?tab=detail-trading-data" 
Page <- read_html(PSE_Page)

Our_table <- Page %>% 
  rvest::html_nodes('body') %>% 
  xml2::xml_find_all("//div[contains(@class, 'stock-table large-table small-text page-block-negative-margin table-container js-swipe-icon')]") %>% 
  rvest::html_text()

Our_table

输出:1“ \ nČas\ n Cena \ nCelkovýobjem \ nCelkovýobjem \ n **

有人可以帮忙吗?非常感谢!!

enter image description here

我对使用R进行网页剪贴完全陌生,我想剪贴一下表现为tbody的下表(图片)。如果运行以下代码,则只会看到标题,而没有数据(网站位于...

r web-scraping dplyr rvest rselenium
2个回答
1
投票

您要引用的表不是静态表。它是动态的,因为您可以使用它进行迭代,例如对表进行排序。因此,您无法使用rvest抓取信息。我实际上不是动态Web抓取的专家,但是此代码段提取了数据。我通过RSelenium软件包使用Web浏览器,可以从R内部对其进行控制,以接收该表的动态内容。不过,可能有更好的解决方案可以完成此工作。


0
投票

也许我过得很辛苦,但是我转到pse.cz/detail/CZ0003519753?tab=detail-trading-data时看不到您要参考的表格。

© www.soinside.com 2019 - 2024. All rights reserved.