有什么方法可以解析Ruby中的远程html页面,最好使用类似选择器的jQuery?
例如,我可以选择具有特定类的所有div,并获取数组中所有这些元素的内容。
我试图为此使用Regex,但是我认为使用XML解析器会更好。
我发现hpricot非常相似。