抓取,按类过滤节点

问题描述 投票:0回答:1

我正在尝试进行一些抓取,但在节点内进行过滤时遇到问题。这段代码得到了一切。

<div id="cocardasContainer">
                                                        <div id="preOrderButton" class="filterCocarda shown">
                                Preorden
                                <img src="/files/info.svg?v2" class="cocardasInfo" id="preOrderInfo">
                            </div>
                            <div id="preorderDiv" style="display: none;">Este artículo es de preorden lo que significa que se produce ”a
                                pedido” una vez efectuada la compra o que se vende en forma anticipada para que te
                                asegures una unidad del producto. Por esto, tené en cuenta que los tiempos de entrega
                                pueden ser mayores. Chequeá la pestaña ENTREGA que encontrás debajo de la descripción
                                por más información.
                            </div>

                                                        <div id="expressShippingButton" class="filterCocarda ">
                                Envio express
                                <img src="/files/info.svg?v2" class="cocardasInfo filterNotInvert" id="expressShippingInfo">
                            </div>
                            <!-- <img class="cocardasArrow expressShipping" src="/files/flechitaArriba.png" alt="" style="display:none"> -->
                            <div id="expressShippingDiv">Este artículo se entrega en un máximo de 48 horas. Válido solo
                                para envíos en Montevideo.
                            </div>

                                                        <div id="nacionalButton" class="filterCocarda shown">
                                Producto nacional
                                <img src="/files/info.svg?v2" class="cocardasInfo" id="nationalInfo">
                            </div>
                            <!-- <img class="cocardasArrow nacional" src="/files/flechitaArriba.png" alt="" style="display:none"> -->
                            <div id="nacionalDiv" style="display: none;">Este artículo fue producido en Uruguay.</div>

                                                        <div id="sustentableButton" class="filterCocarda shown">
                                Sustentable
                                <img src="/files/info.svg?v2" class="cocardasInfo filterNotInvert" id="sustentableInfo">
                            </div>
                            <!-- <img class="cocardasArrow sustentable" src="/files/flechitaArriba.png" alt="" style="display:none"> -->
                            <div id="sustentableDiv" style="display: none;">Este artículo fue producido con materiales sostenibles.</div>
                        </div>

我正在做这个:

characteristics_element <- html_node(product_page, "#cocardasContainer")

但我只想要带有“filterCocarda shown”类的“#cocardasContainer”的信息。
我怎样才能做到这一点?

r web-scraping rvest httr
1个回答
0
投票

可以在“#cocardasContainer”节点中查找 div 标签,其中 class="filterCocarda shown"

html_element(page, "#cocardasContainer div[class= 'filterCocarda shown']")

#Output:
#{html_node}
#<div id="preOrderButton" class="filterCocarda shown">
#[1] <img src="/files/info.svg?v2" class="cocardasInfo" id="preOrderInfo">
© www.soinside.com 2019 - 2024. All rights reserved.