nokogiri 相关问题

适用于Ruby的HTML,XML,SAX和Reader解析器,能够通过XPath或CSS3选择器搜索文档......等等

如何使用Nokogiri(以及XPATH和CSS)提取HTML链接和文本

((更新:此答案是从Nokogiri的角度编写的,但是如果您要为特定查询寻找XPATH或CSS语法,它也很有用。)我喜欢Nokogiri -这是一个很棒的工具...] >

回答 1 投票 5

通过Ansible控制Vagrant插件依赖性

我有一本Ansible剧本,它安装了Vagrant,然后指示Vagrant安装特定的插件。 Vagrant无法安装所需的gem,并说:安装...

回答 2 投票 3

带有未关闭img标签的问题

以HTML格式显示并提交给服务器的数据,它需要进行一些预处理。它使用“ img”标签的“ src”属性运行。预处理并保存后,所有经过预处理的“ img”标签...

回答 3 投票 3

如何让Nokogiri从Ruby中的span抓取文本

我正在尝试使用Nokogiri和Curb从网站上抓取信息,但我似乎找不到正确的名称/来找到要抓取的地方。我正在尝试抓取API密钥,该密钥位于...

回答 1 投票 0

在ruby中安装nokogiri时出现此错误,每当我安装某些东西时都会出现此错误

安装nokogiri时发生此错误错误:安装nokogiri时出错:支持您的Ruby&RubyGems的nokogiri的最新版本(> = 0)为1.10.7。尝试使用gem install安装它...

回答 2 投票 -1


如何使用Nokogiri解析页面

我正在编写解析器,发现无法解析http://ekaterinburg.irr.ru/equipment/trade/showcase/。我有代码:link =“ http://ekaterinburg.irr.ru/equipment/trade/showcase/”页面= open(link,...

回答 1 投票 -1

如何找到嵌入的“ a”标签

我在p.user_info中找不到标签: [

回答 2 投票 -5

如何使用Nokogiri从子字符串数组中抓取某些字符串的页面

我想在餐厅页面上抓取某些菜式。我创建了一个包含关键字的数组:myarray = {“ Rice”,“ Soup”,“ Chicken”,“ Vegetables”}每当在...

回答 2 投票 -1

如何使用Waitr :: Browser显示动态网站内容以供Nokogiri抓取

我创建了一个刮板,可以在各个职业站点上找到工作。在大约80%的网站上都可以使用,但是我很难在其余页面上使用。我以为原因是...

回答 2 投票 1

我无法解析页面并获得链接Nokogiri

我无法通过Nokogiri解析获得链接列表,https://chromedriver.storage.googleapis.com/index.html?path = 79.0.3945.36 /我在做什么错?链接= Nokoiri :: HTML('https:// chromedriver ....

回答 2 投票 0

Waitr :: Browser并未显示要Nokogiri抓取的动态网站内容

我创建了一个刮板,可以在各种职业网站上找到工作。在大约80%的网站上都可以使用,但是我很难在其余页面上使用。我以为原因是...

回答 2 投票 1

Waitr :: Browser并未显示要Nokogiri抓取的动态网站内容

我创建了一个刮板,可以在各种职业网站上找到工作。在大约80%的网站上都可以使用,但是我很难在其余页面上使用。我以为原因是...

回答 1 投票 0

如何使Nokogiri在中使用CDATA解析XML

我有一个具有以下内容的XML文件: ![CDATA [FIRSTNAME LASTNAME MIDDLENAME] 3731 4

回答 1 投票 0

捆绑Nokogiri问题

我有一个可以使用以下方式安装Nokogiri的问题:gem install nokogiri --version但是,当我运行捆绑软件时,出现以下错误:ArgumentError:不匹配的双引号:“ \\\\'-with-xml2- ...

回答 1 投票 0

从带有nokogiri的子字符串数组中的某些字符串抓取页面

我想在餐厅页面上抓取某些菜式。我创建了一个包含关键字的数组:myarray = {“ Rice”,“ Soup”,“ Chicken”,“ Vegetables”}每当在...

回答 2 投票 0

Nokogiri / Mechanize xpath定位器在出现杂散开始标签时中断

我使用Mechanize加载了一个页面:url ='http://www.blah.com'agent = Mechanize.new page = agent.get(url),并尝试使用XPath选择器访问元素:found = page。 at('/ html / body / table')...

回答 3 投票 1

红宝石网页的视觉分析

我正在寻找编写一些对网页进行可视化分析的代码,最好使用Ruby。我的代码将需要能够确定顶部,左侧,宽度,高度,背景颜色,颜色和字体...

回答 2 投票 3

Nokogiri刮ing

我想剪贴每个视频的标题和链接。 doc = Nokogiri :: HTML(open('http://www.stream2u.me/'))doc.css('。lshpanel')。每个| link | binding.pry放入link.elements [1] .text放入“ ...

回答 1 投票 -1

用Nokogiri刮擦网站

我正在使用Nokogiri抓取网站,当我尝试从表中获取字段时遇到问题。我正在使用选择器小工具来查找表的CSS选择器。我正在从...

回答 1 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.