使用Nokogiri解析特殊字符的文档

问题描述 投票:0回答:3

我正在使用Nokogiri解析包含特殊字符的网页,但是无法正确解析这些特殊字符,它们显示为“genericÃgica”,这是我打开文档的方式

def self.get_chapter book,chapters
        doc=Nokogiri::HTML(open("#{BASE_URL}search=#{book}#{chapters}&version=NVI")).css('.result-text-style-normal')
        doc.css('.footnotes').remove
        doc.css('h4').remove
        doc
end

关于如何解决此问题的任何想法?

ruby-on-rails ruby nokogiri
3个回答
2
投票
编辑:我在查看页面,您如何尝试处理页面方面做了更多工作,并认为效果更好。我还更改了您对页面的处理方式,因为它的可维护性和可读性不如我希望的那样清晰。

0
投票
将Nokogiri ::

HTML


-1
投票
如果您使用的是1.9,则只需输入
© www.soinside.com 2019 - 2024. All rights reserved.