使用Rvest从class = "section wrapper "中提取数据。

问题描述 投票:1回答:1

我相信类似的问题之前已经有人回答过了,但是我很想了解为什么Rvest不能从class = "section wrapper "中提取数据。我用的是R Studio,总之。

anasj_103 = read_html("https://www.hockey-reference.com/boxscores/201810030SJS.html")

ana_table = anasj_103 %>%
    html_node(xpath = '//*[@id="ANA_skaters"]') %>%
    html_table()

adv_ana = anasj_103 %>%
    html_node(xpath = '//*[@id="ANA_adv"]') %>%
    html_table()

出现的错误是: UseMethod("html_table")出错:没有适用于 "html_table "的方法应用于 "xml_missing "类的对象。

ana_table在使用Xpath时工作得很好,但是adv_ana在使用类似的代码时,却给出了一个错误或者什么都不返回.我遇到了这个问题,所有的数据都是在一个div节中,后面是那个类。由于我甚至不能在section包装中返回基本的文本,我确信这是问题所在。

有什么想法或解决方法吗?

r web-scraping rvest
1个回答
0
投票

感谢QHarr的帮助。以上问题是用解决的。

table = anasjs_103 %>%
    html_nodes(xpath = '//comment()') %>%
    html_text() %>%
    paste(collapse = '') %>%
    read_html() %>%
    html_node('table#ANA_adv') %>%
    html_table()
© www.soinside.com 2019 - 2024. All rights reserved.