screen-scraping 相关问题

屏幕抓取(也称为网络抓取或数据抓取)是一种用于从用户界面收集和解析信息的软件技术。如果您的问题是关于从网站或Web-API进行抓取,请使用[web-scraping]标记。

如何在网页抓取时绕过验证码

我正在尝试使用 Selenium 从该网站抓取汽车详细信息:https://www.autoscout24.ch/de/autos/alle-marken?vehtyp=10 大约每 30 页我就必须验证我不是机器人, 电子...

回答 4 投票 0

使用BeautifulSoup进行网络清理时遇到的问题

我的问题是我无法捕捉类listing_LinkedListingCard__5SRvZ的div我使用find_all但结果是空列表 链接:https://sa.aqar.fm/%D9%81%D9%84%D9%84-%D9%84%D9%84%D8%A8%D9%...

回答 1 投票 0

在java中屏幕抓取主机屏幕?

我是编程世界的新手,在我的项目中我需要使用 Attachmate 屏幕抓取主机屏幕?谁能告诉我屏幕抓取到底是什么以及它是如何工作的? 谢谢你的建议...

回答 3 投票 0

如何借助selenium点击网站上的“月份”按钮?

我需要能够单击网站上的某个按钮。它位于匈牙利能源市场。我正在使用硒来自动化几个步骤。我收到一个 cookies 弹出窗口,我成功点击了它,但是......

回答 1 投票 0

find_elements_by_xpath 不起作用并返回空列表

我正在尝试抓取 reddits,当 URL 页面 = 'https://www.reddit.com/r/announcements/hot/' 时,下面的代码可以工作 但是,当我稍微更改一下 URL 时,page='https://www.reddit.com/r/

回答 1 投票 0

使用 Python selenium 提取 Instagram 帖子描述

早上好, 我目前正在尝试使用 Python selenium 下载 Instagram 帖子的某个字段。具体来说,我正在尝试下载图片的标题(描述)(对于

回答 4 投票 0

我需要有关点击操作的帮助

这是我的第一个问题:) 我正在寻找一个网站,当接受 cookie 时,我的最后一行出现了问题。饼干 我的最后一行有问题。我尝试使用 CSS 选择器 /...

回答 1 投票 0

如何从每天更新的网站上抓取信息? [已关闭]

我想从每个“Represa...”的“Volumen Util (Hm3)”列中抓取信息,所有这些都来自此链接:https://autodema.gob.pe/reportesom/frmRepChili.aspx。 这是一个...

回答 0 投票 0

如何使用pyppeteer点击带有特定文本的链接

我正在尝试单击带有特定文本的链接,这是一个从网站注销的按钮。 在此处输入图像描述 button = await page.xpath("//a[contains(., 'Abmelden')]") 上面的...

回答 1 投票 0

使用次日日期抓取日历数据问题

早上好,我有一个我不知道如何解决的问题,通过网络抓取,我从我工作的网站上获取数据,并用我的班次创建一个 ics 日历文件,它几乎总是有效......

回答 0 投票 0

R Glassdoor 网页抓取

我的任务是为不同的医院收集 Glassdoor 评论,但我很难提取优点、缺点、对管理的建议、推荐、CEO 批准、业务前景和......

回答 2 投票 0

如何使用“msxml2.xmlhttp”从表中获取数据

HTMLI 正在尝试从网页 https://www.lbma.org.uk/prices-and-data/precious-metal-prices#/table 获取数据 所有的 q 和在线示例看起来都很简单,但我像 kip 一样四处拍打......

回答 1 投票 0

为什么从特定网站抓取效果不佳?

我想从此网址中删除所有警报详细信息 - https://www.oref.org.il/12481-en/Pakar.aspx 我写了这段代码,但我认为是因为“在过去一周”不活跃,所以找不到...

回答 1 投票 0

从具有 API 的文档中抓取数据

我是 JS 及其框架的新手,我正在尝试创建一个抓取机器人,它使用 pandadoc 中生成的文档中的数据(当然使用私钥)并将该数据存储...

回答 0 投票 0

抓取时如何删除标签

GMC: 123456 我只需要这里的 GMC 编号,当我抓取它时,它将显示为 GMC : 123456。 如何从那里删除“b”标签? 我正在使用 python 3.10.5 和 BeautifulSoup。 来自 bs4 我...

回答 0 投票 0

我需要从这个应用程序中抓取一些文本

在这里输入图片描述 我需要从这个应用程序中为每个页面获取选定数量的文本 我尝试使用 power automate 和 uipath 但可能是它的技能差距它不太有效和文本 c ...

回答 0 投票 0

在包含侧面板信息的网站上抓取地图

我需要从以下网站抓取澳大利亚的所有充电站。 网址 - https://www.plugshare.com/ 我尝试使用 beautifulsoup 并没有得到预期的结果。 我需要得到...

回答 0 投票 0

使用 beautifulsoup 提取网站中的文本

我需要按照所附图像提取 md-card 容器中的上下文。 我只需要将摘录作为文本或任何格式。 我试过使用 bs 但它不起作用。 请提出一个方法...

回答 0 投票 0

只在 linkedin 上抓取工作页面的一侧?使用硒

来自 selenium import webdriver 导入时间 将熊猫导入为 pd 导入操作系统 从 selenium.webdriver.support.select 导入选择 从 selenium.webdriver.support.ui 导入 WebDriverWait 来自硒。

回答 0 投票 0

Web 抓取反应组件,仅在视图中呈现 [重复]

我想抓取一个 React 网站,但组件只有在可见时才会添加到 DOM。 有办法解决这个问题吗?

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.