R中的废链接

问题描述 投票:0回答:1

我正在R上做一个项目。我想找到链接aosmith.com,因为它已在Wikipedia页面https://en.wikipedia.org/wiki/A._O._Smith上公开。可能我的问题再次被问到,但我还没有找到解决的办法。我到目前为止所做的是以下操作,但没有成功:

library(rvest)
library(magrittr)

url <- "https://en.wikipedia.org/wiki/A._O._Smith"
links <- read_html(url) %>% html_nodes(., ".lister-item-header a") %>% html_attr(., "href")
r web-scraping
1个回答
0
投票

这将返回链接列表:

library(rvest)
library(magrittr)

url <- "https://en.wikipedia.org/wiki/A._O._Smith"
links <- read_html(url) %>% html_nodes("a") %>% html_attr("href")

话虽如此,我不确定您要使用哪种逻辑来查找URL。我很确定您不打算每次都完全匹配,否则为什么您需要为已有的URL抓取网页。如果您可以澄清,我将更新答案。

© www.soinside.com 2019 - 2024. All rights reserved.