rvest 相关问题

rvest是R的一个软件包,它提供从网页中抓取信息的功能。

Web scrape同义词

我正在尝试从美国国家癌症研究所词库数据库中检索同义词,但是在寻找正确的html时遇到了一些麻烦。下面是我的代码和数据框...

回答 1 投票 0

我如何在下拉菜单中获取href

我如何获得每个程序名称和名称? library(rvest)hk_university%html_nodes(“ td.prog__cell a”)%> ...

回答 1 投票 -1

尽管代码正确,为什么我仍然得到错误的输出?

我正在抓取该网站,并确保代码正确无误,以获取标题。但是输出不是我想要的。库(rvest)网址

回答 1 投票 0

使用xpath在R中使用xml2读取sbml文件

我真的是xml的新手,我正尝试使用R中的xml2包读取sbml文件。sbml演示文件取自sbml主页。我对如何使用...

回答 1 投票 1

使用R对HTML数据进行Web抓取

我正在尝试使用R从以下网站中抓取一些数据,以获取所有国家和与这些国家相关的大洲的数据框。 https://www.worldatlas.com/cntycont.htm ...

回答 1 投票 1

RVest:删除访问受限的网站的文本

我目前正在使用rvest对新闻网站进行网络抓取。刮板正在运行,但是在新闻站点上,我只能访问那里列出的独家文章。因此,我需要一个工作循环,不需要...

回答 1 投票 0

如何获取或不希望跳过NA值?

我正在使用rvest来(尝试)从名为RePEc的学术出版物数据库中检索所有作者隶属关系数据。我有作者的短ID(author_reg),我用它来抄取...

回答 1 投票 1

如何从MarineTraffic抓取位置数据

我想使用RStudio刮取船只的位置数据:这是链接-https://www.marinetraffic.com/zh-CN/ais/details/ships/shipid:199293我的代码:“ https:// www .marinetraffic.com / en / ais / ...

回答 1 投票 0

使用estest获取确诊的冠状病毒病例数

我正在尝试创建一个抓取程序以获取有关冠状病毒病例数的更新,并且我正在使用以下页面。当我给xpath确认病例数时,它显示为“ 0”,而不是...

回答 1 投票 0

使用rvest,xml2和选择器小工具进行web报废会导致xml_missing

我正在尝试从以下网址中抓取信息:https://www.google.com/search?q=812-800%20H%20St%20NW我要检索突出显示的“ 812 H St NW”: target选择器小工具(chrome ...

回答 1 投票 0

如何排除R中的某些节点?

我正在抓取网站,并希望排除一些节点。 url%html_nodes(“ div ....

回答 1 投票 0

Rvest-无法读取网站内容-不知道要选择哪个节点

说明,我正在抓取网页以检索相关数据。作为示例,我将使用以下URL:示例https://isbnsearch.org/search?s=THE+GODFATHER+%2C+Mario+Puzo我的第一个迭代是...

回答 2 投票 0

在R中从数据帧进行Web抓取

[从下面的数据框中,我试图使用rvest软件包将网站上的每个词的词性和同义词从以下网址抓取:https://www.thesaurus.com/browse/research?s = t转换为csv。我是...

回答 1 投票 -2

从Yahoo Finance提取数据

我创建了下面的代码,非常适合从Yahoo Finance获取特定公司的一些数据(股价和交易量)。我的挑战是我只有100个观测值。我想...

回答 1 投票 1

rvest html_table()产生错误

我正在尝试从https://finance.yahoo.com/screener/predefined/small_cap_gainers?offset=0&count=100 require('rvest')url中获取表]]

回答 1 投票 0

如何从html的href链接上找到比特流url

我正在使用rvest R软件包从此网页中抓取PDF文件,但是在单击名称为AC1-96-21-01-2011的公开网址后,最终链接是公开的(作为比特流网址-不管是什么)。 .pdf。 ...

回答 1 投票 0

在R中的空单元格前折叠字符串

我想在标签“ p”内刮掉所有具有“ content-text__container”类的内容。在抓取时,某些句子排在下面。我想折叠,所以该段是...

回答 1 投票 0

R中的Web抓取:解析HTML表的问题

我一直在尝试从网站上刮取一张表,以便可以在R中对其重新格式化。我以前在其他网站上都这样做过,但是发现这特别具有挑战性。我的代码如下:...

回答 1 投票 0

rvest :: html_nodes返回部分列表(仅几项)

在R中使用rvest。尝试从电影JFK的IMDB页面中刮取演员的姓名(https://www.imdb.com/title/tt0102138/fullcredits?ref_=tt_ql_1)。 SelectorGadget说我想要的地方...

回答 2 投票 0

将Google可视化表从网页中刮入R

[尝试从此网页简化市场评估表:https://www.starcapital.de/en/research/stock-market-valuation/该网站是动态的,并询问用户位置。感兴趣的表是...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.