如何使用Nokogiri的xpath和at_xpath方法

Question

我正在学习如何使用Nokogiri，基于此代码，我遇到了几个问题：

require 'rubygems'
require 'mechanize'

post_agent = WWW::Mechanize.new
post_page = post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')

puts "\nabsolute path with tbody gives nil"
puts  post_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div[2]').xpath('text()').to_s.strip.inspect

puts "\n.at_xpath gives an empty string"
puts post_page.parser.at_xpath("//div[@id='posts']/div/table/tr/td/div[2]").at_xpath('text()').to_s.strip.inspect

puts "\ntwo lines solution with .at_xpath gives an empty string"
rows =   post_page.parser.xpath("//div[@id='posts']/div/table/tr/td/div[2]")
puts rows[0].at_xpath('text()').to_s.strip.inspect


puts
puts "two lines working code"
rows =   post_page.parser.xpath("//div[@id='posts']/div/table/tr/td/div[2]")
puts rows[0].xpath('text()').to_s.strip

puts "\none line working code"
puts post_page.parser.xpath("//div[@id='posts']/div/table/tr/td/div[2]")[0].xpath('text()').to_s.strip

puts "\nanother one line code"
puts post_page.parser.at_xpath("//div[@id='posts']/div/table/tr/td/div[2]").xpath('text()').to_s.strip

puts "\none line code with full path"
puts post_page.parser.xpath("/html/body/div/div/div/div/div/table/tr/td/div[2]")[0].xpath('text()').to_s.strip

在XPath中使用//或/更好吗？ @AnthonyWJones说“使用不带前缀的//”不是一个好主意。
我必须从任何可用的XPath中删除tbody，否则我得到了nil结果。如何从XPath删除元素以使事情正常进行？
如果不使用完整的XPath，是否必须两次使用xpath提取数据？
为什么我不能使at_xpath起作用以提取数据？它在“ How do I parse an HTML table with Nokogiri?”中运行良好。有什么区别？

Answer 1

[//意味着每个级别的每个节点，因此与/相比，它要昂贵得多。
您可以将*用作占位符。
否，您可以进行XPath查询，获取元素，然后在节点上调用Nokogiri的text方法。
当然可以。看看“ What is the absolutely cheapest way to select a child node in Nokogiri?”和我的基准文件。您将看到at_xpath的示例。

我发现您经常使用text()表达式。使用Nokogiri不需要此操作。您可以检索该节点，然后在该节点上调用text方法。它便宜得多。

还要记住，Nokogiri支持CSS选择器。如果您使用的是HTML页面，它们可能会更容易。

如何使用Nokogiri的xpath和at_xpath方法

问题描述投票：5回答：1

1个回答

最新问题

如何使用Nokogiri的xpath和at_xpath方法

问题描述 投票：5回答：1

1个回答

最新问题

问题描述投票：5回答：1