如果我有一堆元素,例如:
<p>A paragraph <ul><li>Item 1</li><li>Apple</li><li>Orange</li></ul></p>
Nokogiri中是否有内置方法可以让我获得包含文本“ Apple”的所有p
元素? (例如,上面的示例元素将匹配)。
Nokogiri现在可以使用CSS的jQuery扩展来做到这一点:
require 'nokogiri'
html = '
<html>
<body>
<p>foo</p>
<p>bar</p>
</body>
</html>
'
doc = Nokogiri::HTML(html)
doc.at('p:contains("bar")').text.strip
=> "bar"
这里是一个可以使用的XPath:
require 'nokogiri'
doc = Nokogiri::HTML(DATA)
p doc.xpath('//li[contains(text(), "Apple")]')
__END__
<p>A paragraph <ul><li>Item 1</li><li>Apple</li><li>Orange</li></ul></p>
尝试使用此XPath:
p = doc.xpath('//p[//*[contains(text(), "Apple")]]')
您也可以使用Nikkou轻松完成此操作:
doc.search('p').text_includes('bar')