screen-scraping 相关问题

屏幕抓取(也称为网络抓取或数据抓取)是一种用于从用户界面收集和解析信息的软件技术。如果您的问题是关于从网站或Web-API进行抓取,请使用[web-scraping]标记。

xpath表达式的结果是对象,应该是元素

我是新手去抓网站,我一直试图用python刮掉谷歌图片(最终制作一个不和谐机器人,但那是无关紧要的)。我做了以下代码来存储图像src的...

回答 2 投票 1

Python - Beautiful Soup - 如何过滤关键字的提取数据?

我想使用Beautiful Soup和请求来抓取网站的数据,我到目前为止我已经得到了我想要的数据,但现在我想过滤它:从bs4 import BeautifulSoup导入请求...

回答 2 投票 1

使用R中的url-list进行Web抓取

我试图从我收集的多个网站上抓取一些网址。我将已经收集的网站保存在名为meetings2017_2018的数据框中。问题是网址与...看起来不太相似

回答 1 投票 0

Robobrowser开发人员代码抛出错误'对象不可订阅'?

所以我收到了这个错误...我回到文档并找到了开发人员的类似代码。我复制并粘贴了它,它也犯了同样的错误。下面是开发人员的代码。 ...

回答 1 投票 0

组织我正在拉动并保存为CSV的数据

下面的链接有很多层的商业列表。我想拉出每家公司的所有联系信息。我有过去过去用于过去表格的代码但是......

回答 1 投票 -5

通过Puppeteer设置SessionStorage

我正在使用木偶戏去抓屏幕。但是,要加载所需页面,需要在SessionStorage(浏览器页面)中设置上下文。到目前为止,我无法做到这一点。任何 ...

回答 1 投票 0

如何从VBA excel代码中解锁X SYSTEM PCOMM ibm as400终端?如果不是autECLOIA.InputInhibited = 0则[复制]

我正在运行一个excel自动化宏来读取IbM as400终端窗口数据。我的宏运行速度比终端窗口快,导致autECLOIA控制台消息系统有时停止红色...

回答 1 投票 2

becomes empty, when I'm trying to get it via BeautifulSoup

我正在尝试解析网站https://www.kp.ru/best/kazan/abiturient_2018/ivmit/中的表格。 Chrome的DevTools向我展示该表是:

回答 1 投票 1

如何将我的输出分成单个youtube网址并放入python 3中的列表?

我想从其他网站制作简单的youtube频道的刮刀,以创建由youtube网站上的链接组成的联系人列表。使用过的libs:beautifulsoup和requests。我有一些......

回答 3 投票 0

为什么我的函数只在其代码的开头工作?

我在这里遇到的问题是,显然,函数执行的唯一代码行是库(rvest)库(RCurl)和url

回答 1 投票 0

代码在网站上找不到任何产品

在这里输入图像描述我写了一些代码(下面的一部分)来废弃商店网站上的所有产品,但它没有找到任何产品...我不知道这个代码有什么问题。有人可以......

回答 1 投票 -3

网页抓取填写(并检索)搜索表单?

我想知道是否有可能“自动化”输入条目以搜索表单并从结果中提取匹配项的任务。例如,我有一份期刊文章清单,我会...

回答 4 投票 5

点击后刮取.aspx网站

我试图从我的中队获取调度数据:https://www.cnatra.navy.mil/scheds/schedule_data.aspx?sq = vt-9我已经想出如何使用BeautifulSoup提取数据: 。

回答 3 投票 1

如何用beautifulsoup刮一个隐藏的桌子

这是关于用beautifulsoup刮一个隐藏的桌子。正如您在本网站所看到的,有一个“choisissezvotreséance”按钮,当我们点击它时会显示一个表格。当我点击...

回答 1 投票 -1

无法刮擦这个网站。如何从这个网站抓取数据?

我不能从这个网站上抓取数据。我试过其他网站,但它可以与其他网站...从bs4导入BeautifulSoup来自urllib.request import urlopen response = urlopen(“https:// www ....

回答 2 投票 -2

这个网站是否可以防止刮擦? [关闭]

我试图从这个网站上废弃:http://www.presanse.fr/CISME/annuaire.aspx为了向您展示我需要废弃的信息,请点击“tous les services”然后列表将会。 ..

回答 2 投票 0

设计一个专门用于渲染文本的开源OCR引擎(截图)

因此,我目前的个人项目是能够自动从游戏中截取屏幕截图,OCR文本,并计算给定单词的出现次数。整晚都在四处看看......

回答 3 投票 3

网页抓取不仅适用于此网站

我使用相同的代码来获取不同网页的价格(特别是7个),所有工作都很完美,但在1中我无法获得任何数据,如果页面有任何数据,你能告诉我是否不可能。 ..

回答 1 投票 0

使用javascript从亚马逊URL抓取ASIN

假设我有一个类似的亚马逊产品网址:http://www.amazon.com/Kindle-Wireless-Reading-Display-Generation/dp/B0015T963C/ref=amb_link_86123711_2?pf_rd_m = ATVPDKIKX0DER&pf_rd_s = center-1&...

回答 13 投票 14

铁网刮板 - 登录

在阅读之前我已经阅读过登录网站的教程,但它只是不起作用。我构造了一个HttpIdentity对象,将其添加到Identities集合中,并处理了请求,...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.