我正在尝试在以下网站上抓取数据框
https://infogram.com/detallecasos-1h7z2l9yqgdy2ow
在R中使用rvest软件包。>>
但是我知道
{xml_nodeset (0)}
我已经尝试解决它,有多个stackoverflow答案,但没有。我感谢谁能帮助我。
library(rvest) read_html("https://infogram.com/detallecasos-1h7z2l9yqgdy2ow") %>% html_nodes('table') %>% html_table(fill = TRUE)
预期输出
我正在使用R中的rvest软件包在以下网站https://infogram.com/detallecasos-1h7z2l9yqgdy2ow上抓取数据帧。但是我得到了{xml_nodeset(0)},我试图用...解决它。 >
这里是代码,它返回表
library(rvest)
library(stringr)
library(rjson)
library(data.table)
pg <- read_html("https://infogram.com/detallecasos-1h7z2l9yqgdy2ow")
Mat <- pg %>% html_nodes("body") %>%
html_nodes("script:contains('window.infographicData')") %>%
html_text() %>% str_extract(string = ., pattern = "\\[\\[.*\\]\\]") %>%
substr(x = ., start = 2, stop = nchar(.)-1) %>% fromJSON() %>%
do.call(rbind, .)
colnames(Mat) = Mat[1, ]
DT <- as.data.table(Mat[-1,-1])
DT
Fecha de diagnóstico Ciudad de ubicación Atención Edad Sexo Tipo* País de procedencia
1: 06/03/2020 Bogotá casa 10 a 19 F Importado Italia
2: 09/03/2020 Buga hospital 30 a 39 M Importado España
3: 09/03/2020 Medellín casa 50 a 59 F Importado España
4: 11/03/2020 Medellín casa 50 a 59 M Relacionado Colombia
5: 11/03/2020 Medellín casa 20 a 29 M Relacionado Colombia
---
227: 22/03/2020 Cali casa 20 a 29 M Importado Estados Unidos
228: 22/03/2020 Cali casa 20 a 29 M Importado España
229: 22/03/2020 Yopal casa 30 a 39 F Relacionado Colombia
230: 22/03/2020 Armenia casa 30 a 39 F Relacionado Colombia
231: 22/03/2020 Cali casa 40 a 49 F Relacionado Colombia