web-scraping 相关问题

Web抓取是从不易提供API或其他自动数据检索方法的网站中提取特定信息的过程。关于“如何开始使用刮擦”（例如使用Excel VBA）的问题应该*进行彻底的研究*，因为有许多功能代码示例可供使用。 Web抓取方法包括第三方应用程序，定制软件的开发，甚至是标准化方式的手动数据收集。

如何获取包含shadowRoot元素的文档或节点中的所有HTML

这个问题我还没有看到满意的答案。这基本上是这个问题的重复，但它关闭不当并且给出的答案不充分。我已经想出了自己的

javascript web-scraping shadow-dom custom-element native-web-component

回答 3 投票 0

将 Scrapy 指向本地缓存，而不是执行正常的蜘蛛抓取过程

我正在使用管道将 Scrapy 抓取的文档缓存到数据库中，这样如果我更改项目解析逻辑，我就可以重新解析它们，而无需再次访问服务器。什么是最好的...

python web-scraping scrapy

回答 2 投票 0

我无法从这个网站抓取内容。是因为数据是动态的吗？

我正在尝试抓取 https://newtin.co811.org/responsedisplay/?ticket=B420800874 的表格中的数据，该网站对每张票有不同的信息，我不知道是否是该网站o。 ..

python pandas database web-scraping

回答 1 投票 0

无法在某些网站上使用剧作家执行无限滚动

我正在爬行https://kick.com/browse/categories，每次滚动时它都会加载某个类别的新卡片。我使用剧作家尝试了多种方法，但没有一个有效。将不胜感激...

python web-scraping web-crawler playwright playwright-python

回答 1 投票 0

Webscraping magento 网站。未指定时间戳时，API 调用具有 200 空响应

magento 网站上用于报废目的的帮助我是个新人，如果有些术语看起来很奇怪，我很抱歉。我正在尝试从个人上下文中删除 Prolians 网站上的数据 https://www.prolians.fr/ w...

ajax api web-scraping magento

回答 1 投票 0

如何使用 rvest 抓取 NBA 统计页面

我感兴趣的抓取页面在这里：https://www.nba.com/stats/teams/opponent-shots-general?GeneralRange=Pullups&SeasonType=Regular+Season 我已经尝试过以下代码

r web-scraping rvest

回答 1 投票 0

如何从该网站抓取/提取数据并将数据导入到 csv 文件中

我们将从该页面提取数据 https://www.brilliantearth.com/en-gb/diamond/round/ 同样，在我们的网站上，https://www.diamondsfactory.co.uk/design/white-gold-round-diamond-engagement-ring-

python web-scraping scrapy extract export-to-csv

回答 1 投票 0

将所有页面从 Angular 站点抓取到静态 HTML 页面

我有一些有趣的任务...... 如何将 Angular 上的网站抓取为静态 HTML？我无权访问项目的文件。我只有域名链接 - https://dit7pokerdom.com/ 我需要创建本地 htm...

angular web-scraping

回答 1 投票 0

在简单的网络抓取查询上使用 Google Sheets 的 ImportXML XPath 问题

我一直在尝试使用谷歌表格导入xml以从URL https://www.pro-football-reference.com/boxscores/201912290car.htm中抓取高级接收表数据，但没有成功。我已经...

xpath web-scraping google-sheets google-sheets-formula

回答 2 投票 0

如何每次从受密码保护的网站获取新的cookie？

我正在尝试抓取一个具有 API 的网站。仅当我们登录时，其中一个 API 才会提供 json。我登录了cookie，然后发送请求，我成功发送了请求。但亲...

python selenium-webdriver web-scraping python-requests

回答 1 投票 0

无法使用 beautifulsoup 获取 div 元素内的所有 span 标签

我正在亚马逊上抓取产品详细信息页面文本，但我以项目符号列表的形式返回数据。我希望将数据添加为其他抓取数据旁边的列。导出csv文件亚马逊产品详细信息...

python web-scraping beautifulsoup

回答 1 投票 0

为什么selenium不下载图像？

在这段代码中，我尝试从页面下载图像，但它没有下载它们，我做过一次，但不再这样做了，我不知道这里有什么不好 `从硒导入网络驱动程序来自 selenium.webd...

python selenium-webdriver web-scraping

回答 1 投票 0

抓取多个页面具有相同网址的网站？页面跳转是ajax请求

我已经这样做好几天了，我正在尝试抓取这个网站：“https://careers.ispor.org/jobseeker/search/results/” 我已经涵盖了从提取

python ajax selenium-webdriver web-scraping beautifulsoup

回答 1 投票 0

之前用于查询 UniProt ID 映射的代码出现 HTTP 错误 405

在我的一个脚本中，我利用以下代码块使用另一种类型的 ID 来查询蛋白质的 ID：导入操作系统导入系统导入 urllib.request uniprot = 'A0A0M3KKX3' url = 'htt...

python http web-scraping urllib

回答 2 投票 0

来自 UniProt 数据库的网页抓取表

我有一个 UniProt ID 列表，想使用 BeautifulSoup 废弃包含结构信息的表。我使用的网址如下：https://www.uniprot.org/uniprot/P03496，带有

python python-3.x web-scraping beautifulsoup

回答 2 投票 0

使用 Microsoft Graph API 的应用程序类型 API 权限

我想创建一个应用程序，通过 Microsoft Graph API 列出 Outlook 中的所有电子邮件。我做了什么： 1）转到“Microsoft Entra ID”（以前的 Active Directory）前往“应用程序注册...

python json web-scraping outlook microsoft-graph-api

回答 1 投票 0

R / Python 中的网页抓取

我需要从 https://eservices.dha.gov.ae/DHASearch/UIPages/ProfessionalSearch.aspx?PageLang=En 提取数据。我需要 4 列 -“姓名”、“性别”、“职称”、“医院名称”、“联系方式”。 ”

python web-scraping beautifulsoup scrapy rvest

回答 2 投票 0

使用请求模块的脚本会生成 428 状态代码

我创建了一个脚本，用于向此网站发出带有适当参数的 POST HTTP 请求，这些参数是根据此图中显示的字段生成的。该脚本应该产生 200

python python-3.x web-scraping python-requests

回答 1 投票 0

我正在尝试从比赛网站上抓取数据，但抓取器没有返回任何结果

从 selenium 导入 webdriver 驱动程序 = webdriver.Chrome() login_url = 'http://www.attheraces.com/racecard/Wolverhampton/6-October-2018/1715' driver.get(login_url) html = driver.execute_script("r...

python html selenium web-scraping

回答 3 投票 0

使用selenium一次性在网页上断言大量文本？

我正在使用什么： C#、Selenium（v 4.20）、NUnit、Visual Studio 场景：我试图断言给定网页上的所有文本都是可见的并且也是正确的文本。我有一把 p...

selenium-webdriver web-scraping selenium-chromedriver nunit

回答 1 投票 0

web-scraping 相关问题

最新问题