在多个span标记内抓取文字(Ruby和Nokogiri)

问题描述 投票:0回答:1

我正在尝试从此HTML结构中抓取“说明”

<div class="menu-index-page__item-content">
 <h6 class="menu-index-page__item-title">
  <span> Item title </span>
 </h6>
 <p class="menu-index-page__item-desc">
  <span>
   <span>
    <span>Description</span>
   </span>
  </span>

每个标签都有一个我不知道如何处理的元素:

data-reactid=".3wrqgx5340.3.5.0.4:$523105.2.$3959254.$menuItemContent.1.0"

每个数据反应堆都不同。因此,如果我定位此属性,则将抓取我不想要的内容。

我已经尝试过.search .xpath,使用标签和类,但似乎无济于事。

有没有办法说:给我一个带有class =“ menu-index-page__item-desc”的p标签,然后从那里刮取第三个跨度?

ruby parsing web-scraping nokogiri
1个回答
0
投票
您可以通过xpath获取所需的值//text()[contains(.,'Description')]
© www.soinside.com 2019 - 2024. All rights reserved.