屏幕抓取(也称为网络抓取或数据抓取)是一种用于从用户界面收集和解析信息的软件技术。如果您的问题是关于从网站或Web-API进行抓取,请使用[web-scraping]标记。
我正在尝试使用 Selenium 从该网站抓取汽车详细信息:https://www.autoscout24.ch/de/autos/alle-marken?vehtyp=10 大约每 30 页我就必须验证我不是机器人, 电子...
我的问题是我无法捕捉类listing_LinkedListingCard__5SRvZ的div我使用find_all但结果是空列表 链接:https://sa.aqar.fm/%D9%81%D9%84%D9%84-%D9%84%D9%84%D8%A8%D9%...
我是编程世界的新手,在我的项目中我需要使用 Attachmate 屏幕抓取主机屏幕?谁能告诉我屏幕抓取到底是什么以及它是如何工作的? 谢谢你的建议...
我需要能够单击网站上的某个按钮。它位于匈牙利能源市场。我正在使用硒来自动化几个步骤。我收到一个 cookies 弹出窗口,我成功点击了它,但是......
find_elements_by_xpath 不起作用并返回空列表
我正在尝试抓取 reddits,当 URL 页面 = 'https://www.reddit.com/r/announcements/hot/' 时,下面的代码可以工作 但是,当我稍微更改一下 URL 时,page='https://www.reddit.com/r/
使用 Python selenium 提取 Instagram 帖子描述
早上好, 我目前正在尝试使用 Python selenium 下载 Instagram 帖子的某个字段。具体来说,我正在尝试下载图片的标题(描述)(对于
这是我的第一个问题:) 我正在寻找一个网站,当接受 cookie 时,我的最后一行出现了问题。饼干 我的最后一行有问题。我尝试使用 CSS 选择器 /...
我想从每个“Represa...”的“Volumen Util (Hm3)”列中抓取信息,所有这些都来自此链接:https://autodema.gob.pe/reportesom/frmRepChili.aspx。 这是一个...
我正在尝试单击带有特定文本的链接,这是一个从网站注销的按钮。 在此处输入图像描述 button = await page.xpath("//a[contains(., 'Abmelden')]") 上面的...
早上好,我有一个我不知道如何解决的问题,通过网络抓取,我从我工作的网站上获取数据,并用我的班次创建一个 ics 日历文件,它几乎总是有效......
我的任务是为不同的医院收集 Glassdoor 评论,但我很难提取优点、缺点、对管理的建议、推荐、CEO 批准、业务前景和......
HTMLI 正在尝试从网页 https://www.lbma.org.uk/prices-and-data/precious-metal-prices#/table 获取数据 所有的 q 和在线示例看起来都很简单,但我像 kip 一样四处拍打......
我想从此网址中删除所有警报详细信息 - https://www.oref.org.il/12481-en/Pakar.aspx 我写了这段代码,但我认为是因为“在过去一周”不活跃,所以找不到...
我是 JS 及其框架的新手,我正在尝试创建一个抓取机器人,它使用 pandadoc 中生成的文档中的数据(当然使用私钥)并将该数据存储...
GMC: 123456 我只需要这里的 GMC 编号,当我抓取它时,它将显示为 GMC : 123456。 如何从那里删除“b”标签? 我正在使用 python 3.10.5 和 BeautifulSoup。 来自 bs4 我...
在这里输入图片描述 我需要从这个应用程序中为每个页面获取选定数量的文本 我尝试使用 power automate 和 uipath 但可能是它的技能差距它不太有效和文本 c ...
我需要从以下网站抓取澳大利亚的所有充电站。 网址 - https://www.plugshare.com/ 我尝试使用 beautifulsoup 并没有得到预期的结果。 我需要得到...
我需要按照所附图像提取 md-card 容器中的上下文。 我只需要将摘录作为文本或任何格式。 我试过使用 bs 但它不起作用。 请提出一个方法...
来自 selenium import webdriver 导入时间 将熊猫导入为 pd 导入操作系统 从 selenium.webdriver.support.select 导入选择 从 selenium.webdriver.support.ui 导入 WebDriverWait 来自硒。
我想抓取一个 React 网站,但组件只有在可见时才会添加到 DOM。 有办法解决这个问题吗?