rvest 相关问题

我正在尝试进行一些抓取，但在节点内过滤时遇到问题。这段代码得到了一切。 ... 我正在尝试进行一些抓取，但在节点内进行过滤时遇到问题。这段代码得到了一切。 <div id="cocardasContainer"> <div id="preOrderButton" class="filterCocarda shown"> Preorden <img src="/files/info.svg?v2" class="cocardasInfo" id="preOrderInfo"> </div> <div id="preorderDiv" style="display: none;">Este artículo es de preorden lo que significa que se produce ”a pedido” una vez efectuada la compra o que se vende en forma anticipada para que te asegures una unidad del producto. Por esto, tené en cuenta que los tiempos de entrega pueden ser mayores. Chequeá la pestaña ENTREGA que encontrás debajo de la descripción por más información. </div> <div id="expressShippingButton" class="filterCocarda "> Envio express <img src="/files/info.svg?v2" class="cocardasInfo filterNotInvert" id="expressShippingInfo"> </div>  <div id="expressShippingDiv">Este artículo se entrega en un máximo de 48 horas. Válido solo para envíos en Montevideo. </div> <div id="nacionalButton" class="filterCocarda shown"> Producto nacional <img src="/files/info.svg?v2" class="cocardasInfo" id="nationalInfo"> </div>  <div id="nacionalDiv" style="display: none;">Este artículo fue producido en Uruguay.</div> <div id="sustentableButton" class="filterCocarda shown"> Sustentable <img src="/files/info.svg?v2" class="cocardasInfo filterNotInvert" id="sustentableInfo"> </div>  <div id="sustentableDiv" style="display: none;">Este artículo fue producido con materiales sostenibles.</div> </div> 我正在做这个： characteristics_element <- html_node(product_page, "#cocardasContainer") 但我只想要带有“filterCocarda shown”类的“#cocardasContainer”的信息。我怎样才能做到这一点？可以在“#cocardasContainer”节点中查找 div 标签，其中 class="filterCocarda shown" html_element(page, "#cocardasContainer div[class= 'filterCocarda shown']") #Output: #{html_node} #<div id="preOrderButton" class="filterCocarda shown"> #[1] <img src="/files/info.svg?v2" class="cocardasInfo" id="preOrderInfo">

r web-scraping rvest httr

回答 1 投票 0

使用 rvest 从 ClinicalTrials.gov 抓取数据表

当我在 ClinicalTrials.gov 上输入搜索词时，我想抓取此数据表。具体来说，我想抓取您在此页面上看到的表格：https://clinicaltrials.gov/ct2/results?term=niv...

r web-scraping rvest

回答 2 投票 0

将图像从网站抓取到子文件夹中

我正在尝试从这个网站抓取图像：hhttps://moweek.com.uy/。有不同的副标题：“VESTIMENTA”、“CALZADO”、“ACCESORIOS”、“BEAUTY”、“

r web-scraping rvest httr

回答 1 投票 0

使用 R 中的 rvest 包从特定页面抓取数据

我想通过网络抓取所有交易过股票或其他金融工具的美国政客的名字。我为此使用的网站的 URL 是“https://www.capitoltrades.com/tr...