mechanize 相关问题

最初为Perl开发的自动Web浏览库,现在还有Python和Ruby实现。

在提交表单之前机械化检查所有单选按钮

对于一个学校项目,我正在尝试抓取多项选择题的内容(以学习法语SAT。我要抓取我的刮板的网页的屏幕截图。但是,该页面...

回答 1 投票 0

[进行更精确的编辑] =抓取Ruby Mechanize-需要在显示完整的html代码之前提交表单

感谢您的回答,我添加了一些代码和详细信息,以使其更加准确。我希望我的问题更容易理解。非常感谢你。 #对于一个学校项目,我正在尝试刮除...

回答 1 投票 0

如何使用Ruby和机械化方法解析格式错误的HTML

我正在使用Mechanize导航HTML格式错误的网站。特别是,我有一个页面,该页面的复选框超出服务器可以合理地处理请求的形式。我想要...

回答 2 投票 3

在机械化中执行LoadControl XHR请求

我有一个带有Mechanize的Python脚本,可以浏览外部网站。该网站显然是用ASP.NET编写的,并且正在使用动态控件。我正在尝试模拟XHR以加载控件(...

回答 1 投票 0

如何使用WWW :: Mechanize(ajax)发布表单

我几天前发布了有关通过更改页面大小来发布表单的信息。有人可以帮忙吗?我包括了表单的转储以及用于发布它的代码。这是要执行的代码...

回答 1 投票 1

WIPO搜索遗失的表格数据POST消息

我正在尝试通过python搜索WIPO品牌注册,但是如果我要检查发送到服务器的formdata,我真的不明白这是什么。表单数据:这是...

回答 1 投票 0

如何在红宝石上刮下一页

我正在尝试抓取名为https://www.jobsatosu.com/postings/search的网站的下一页。因为工作很多,所以页面很多。我们的小组成功抓取了第一页...

回答 1 投票 -1

如何使用Mechanize / Nokogiri获取页面源

我已使用Mechanize登录到网页/ servlet。我有一个页面对象:jobShortListPg = agent.get(addressOfPage)当我使用:puts jobShortListPg我得到了页面的“机械化”版本,它是...

回答 3 投票 23

WebDriverException:Service…\ firefox.exe使用GeckDriver Firefox通过Selenium意外退出了错误

Selenium使用Google登录拒绝的“假”浏览器(“此浏览器应用程序不安全”),机械化缺少GUI,Web浏览器无法单击。是否有任何可以打开“常规”浏览器的程序包,......>

回答 3 投票 1

WebDriverException:服务C:\ Program Files \ Firefox开发人员版本\ firefox.exe意外地通过使用Selenium的GeckDriver Firefox退出了错误

Selenium使用Google登录拒绝的“假”浏览器(“此浏览器应用程序不安全”),机械化缺少GUI,Web浏览器无法单击。是否有任何可以打开“常规”浏览器的程序包,......>

回答 3 投票 1

使用Python在浏览器中单击按钮

Selenium使用Google登录拒绝的“假”浏览器(“此浏览器应用程序不安全”),机械化缺少GUI,Web浏览器无法单击。是否有任何可以打开“常规”浏览器的程序包,......>

回答 1 投票 0

刮取动态网站是否有特定方法?

我正在尝试抓取以下网页。搜索框(显示输入安全名称/代码/ ID)是我遇到的困难。我无法使用xpath进行抓取,我正在使用机械化库来实现...

回答 1 投票 0

使用Python执行vBulletin论坛登录

早上好!我想登录vbulletin论坛。登录后,您将被重定向到主页,我想获取仅当im ...

回答 1 投票 1

如何使用Mechanize登录和抓取站点

我正在尝试使用Mechanize登录和抓取网站。由于某种原因,我似乎无法使登录功能正常工作。有任何想法吗?这是我的代码:require'nokogiri'require'open-uri'require'...

回答 2 投票 0

Web抓取Yelp,如何检索每个单独评分的值? [重复]

[从事网络抓取项目以建立我的知识(初学者)。这段代码很乱,但目前我可以打印每条评论的评分。如何从...

回答 1 投票 0

[使用Python与包含动态列表的网页进行交互

我正在尝试编写Python程序以自动向todoist添加任务。我目前正在尝试使用机械化,但不确定是否是我需要的,因为它已设置为与表单进行交互,并且...

回答 1 投票 0

Nokogiri / Mechanize xpath定位器在出现杂散开始标签时中断

我使用Mechanize加载了一个页面:url ='http://www.blah.com'agent = Mechanize.new page = agent.get(url),并尝试使用XPath选择器访问元素:found = page。 at('/ html / body / table')...

回答 3 投票 1

如何使用Nokogiri和Mechanize刮除标签

我正在尝试从“圣保罗使徒详细信息页面”中获取信息。我需要地址,电话号码和说明。所有这些信息都可以通过普通的HTML标签访问...

回答 2 投票 0

是否可以获取域的站点地图?

作为任务的一部分,我正在尝试获取网页上的所有链接和子域。例如,“ www.stanford.edu”返回哈希值“ www.stanford.edu/admissions”,“ www.stanford.edu / ...

回答 2 投票 0


© www.soinside.com 2019 - 2024. All rights reserved.