nokogiri 相关问题

适用于Ruby的HTML,XML,SAX和Reader解析器,能够通过XPath或CSS3选择器搜索文档......等等

如何摆脱阵列中的幻像行?

我正在用httparty刮一堆表,然后用nokogiri解析响应。一切正常,但是然后我在顶部出现了一个幻像行:require'nokogiri'require'httparty'require'...

回答 2 投票 0

为什么HTML :: fragment不起作用而:: XML起作用?

我一直在尝试对某些HTML片段进行一些处理,在使用Nokogiri时,我遇到了一个我似乎无法理解的问题。我正在使用此代码:doc = Nokogiri :: HTML :: fragment xml ...

回答 1 投票 0

为什么Nokogiri找不到这个img标签?

我的开头是:text =“亲爱的哈里, 希望您在当前陌生的时代一切都好,并且您没有遭受太多孤立的痛苦。请看我刚得到的交付:

回答 2 投票 0

如何删除重复的HTML元素?

我有以下input.html,其中包含多个重复的

回答 1 投票 0

是否有一种方法可以解析在ruby标签中包含javascript的html?

我正在研究Ruby中的网络抓取问题。我已经看到了与此相关的多个问题和答案,但是没有一个人看到HTML中包含一些JavaScript框架,因此无法理解...

回答 1 投票 1

如何使用具有特定td类的Nokogiri显示节点

我在显示特定[]中的所有类时遇到问题> 标签和类。它应该显示链接中的所有四个项目,但只显示第一项。 IP应该在...

回答 1 投票 -4

如何搜索两条路径,但使用Nokogiri依次获得结果

我正在尝试使用Nokogiri搜索前缀为w以及t或br的元素。例如,如果这是解析后返回的文档的核心: &...

回答 1 投票 -1

使用正则表达式获取Nokogiri节点

我正在用Nokogiri解析XML文件。当前,我正在使用以下方法获取所需的值(文档包括多个Phase节点):xml.xpath(“ // Phase [@ text ='= STER P = P(T)']”).. 。

回答 1 投票 -2

如何从Nokogiri :: XML :: NodeSet获取随机元素

我正在尝试从Nokogiri NodeSet中获取随机元素。我尝试了nodeset.sample(10),其中nodeset = html_page.css('div')但是这会导致错误:#

回答 1 投票 -1

从Nokogiri :: XML :: NodeSet获取随机元素

我正在尝试从Nokogiri NodeSet中获取随机元素。我已经尝试过nodeset.sample(10),其中nodeset = html_page.css('div')但是,这会导致未定义错误的方法#sample>

回答 1 投票 0

如何解析基于JavaScript的页面

我无法从使用JavaScript投放的网页上获取安大略省冠状病毒的HTML。我在Ruby中使用Nokogiri。 Ruby检索的站点更多是一个警告/解释页,该页显示我的浏览器...

回答 1 投票 1

如何使用Nokogiri抓取Google搜索

我想在“拼写检查”部分中刮一些Google搜索页面。例如,如果我搜索“心血管疾病”,它将链接到https://www.google.com / ...

回答 1 投票 -1

如何解析Google搜索页以使用Nokogiri获得结果统计信息和AdWords计数

我正在尝试使用以下代码来抓取Google搜索页面以学习抓取方法:doc = Nokogiri :: HTML(open(“ https://www.google.com/search?q=cardiovascular+diesese”))我想得到结果...

回答 2 投票 -1

使用Nokogiri Ruby分析Google搜索页面以获取结果统计信息和AdWords计数

首先让我说,不要将其用于任何现实生活中的项目。仅用于教育目的。我正在尝试抓取如下所示的Google搜索页。 doc = Nokogiri :: HTML(open(“ https://www.google.com/search?q = ...

回答 1 投票 -1

如何使用Nokogiri对XML文件进行许多更改

我正在使用Nokogiri将超过8万行的很大的XML文件转换为CSV格式。我需要将

回答 2 投票 0


如何使用Nokogiri和Ruby解析JavaScript

我需要从网站解析数组。我要解析的JavaScript部分如下所示:_arPic [0] =“ http://example.org/image1.jpg”; _arPic [1] =“ http://example.org/image2.jpg”; _arPic [...

回答 2 投票 5

如何在Ruby 2.7.0上安装Nokogiri

我最近升级到Ruby v2.7.0。当我尝试安装Nokogiri时,出现以下错误:错误:安装nokogiri时出错:nokogiri的最新版本(> = 0)以支持您的Ruby ...

回答 1 投票 1

在多个span标记内抓取文字(Ruby和Nokogiri)

我正在尝试从此HTML结构中刮取“描述” [[[项目标题 ...

回答 1 投票 0

在提交表单之前机械化检查所有单选按钮

对于一个学校项目,我正在尝试抓取多项选择题的内容(以学习法语SAT。我要抓取我的刮板的网页的屏幕截图。但是,该页面...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.