web-scraping 相关问题

Web抓取是从不易提供API或其他自动数据检索方法的网站中提取特定信息的过程。关于“如何开始使用刮擦”(例如使用Excel VBA)的问题应该*进行彻底的研究*,因为有许多功能代码示例可供使用。 Web抓取方法包括第三方应用程序,定制软件的开发,甚至是标准化方式的手动数据收集。

我无法使用特定 URL 在 Python Selenium 中找到任何元素

我正在尝试开发一个代码来获取网站每个产品中的所有成分,但是当我尝试使用“driver.find_element”时,我的 Selenium 找不到任何元素。 我用了: 铬驱动...

回答 1 投票 0

使用Python(Selenium + BeautifulSoup)从交互式图表中提取数据

我需要从此链接中的资产演变图表中提取数据(示例):https://investidor10.com.br/carteira/572422/(附有图表图像)。我需要我存在的所有条形图的数据...

回答 1 投票 0

如何使用BeautifulSoup从HTML中抓取表格数据?

我一直在尝试从这个网站上抓取表格https://www.alphaquery.com/stock/aapl/earnings-history 但我无论如何也无法实现它。我什至找不到桌子。 导入请求 来自 BS4 我...

回答 1 投票 0

如何从 HTML 中抓取表格数据?

我一直在尝试从这个网站上抓取表格https://www.alphaquery.com/stock/aapl/earnings-history 但我无论如何也无法实现它。我什至找不到桌子。 导入请求 来自 BS4 我...

回答 1 投票 0

从动态变化的网站上抓取评论

我需要从 Debank 网站的帖子中抓取/解析评论。 例如:https://debank.com/stream/2057406 问题是,如果我滚动网站,html 会发生变化并实时呈现评论。

回答 1 投票 0

使用 rvest 从网络上抓取元素

我正在尝试从网站上抓取元素:https://diga.bfarm.de/de/verzeichnis 我的目标是从所有 class="entity-app" 创建一个表 图书馆(rvest) 文件 <- read_html(...

回答 1 投票 0

通过Python或其他更好的工具根据日期自动将每日更新的多个网页转换为单个pdf

我正在准备考试,这些网站会定期上传时事。 我不想每天重新打开这些多个网站,而是想通过下载来简化这个过程......

回答 1 投票 0

使用Python从URL下载m3u8

我开始使用Python学习网络抓取。目前,我想下载日本饮食的视频。 (https://www.shugiintv.go.jp/jp/index.php?ex=VL&deli_id=40124&media_type=) 该...

回答 2 投票 0

BBC 足球网页抓取问题

我正在尝试抓取此页面以获取表数据: https://www.bbc.com/sport/football/premier-league/table 但我最终得到的是网页的不同部分 table_MN = pd.read_html('http...

回答 2 投票 0

Selenium 网络抓取脚本未返回预期结果

我有一个使用 Selenium 的 Python 脚本,用于从网站上抓取公司信息。该脚本昨天工作正常,但今天它没有返回任何结果,即使我没有......

回答 1 投票 0

如何抓取ETH区块链

我正在启动一个新项目,我想从以太坊区块链中抓取钱包地址及其交易数据,以了解它们的盈利能力。 大家有什么工具可以推荐...

回答 1 投票 0

使用Selenium进行页面导航但网页老是返回首页

我正在尝试从(https://ec.europa.eu/info/funding-tenders/opportunities/portal/screen/opportunities/calls-for-proposals?isExactMatch=true&status=

回答 1 投票 0

在VBA中获取HTML元素

我正在尝试从皇家造币厂网站获取硬币的价格。 我需要的元素没有 ID 或类名。 使用 Chrome 开发者工具,我想我已经在

回答 1 投票 0

使用 python 进行网页抓取(黑客新闻)

代码 我想抓取 Hackernews 提要的标题、标题超链接和分数。当我运行上面的代码时,会显示标题和分数,但不会显示超链接。有什么办法可以解决...

回答 1 投票 0

如何使用 python 3 抓取亚马逊

我正在尝试阅读给定产品的所有评论,这既是为了学习Python,也是为了一个项目,为了简化我的任务,我随机选择了一个产品来编码。 我想阅读的链接是A...

回答 4 投票 0

使用下拉菜单的Python Selenium 脚本

我正在尝试一个与未来加拿大健康和安全行业职业愿望相关的有趣项目,这也将帮助我培养 Python 技能。有一个网站提供加拿大占领的数据...

回答 1 投票 0

我尝试使用 scrapy playwright 滚动浏览网上商店以抓取所有产品,但它不起作用

我尝试单击“加载更多”按钮,直到它消失并加载所有产品。然后我想点击所有单个产品以从各个产品中抓取我需要的数据...

回答 1 投票 0

如何抓取足球周结果

我想获得虚拟足球联赛的结果,并根据此 Excel 文件中所示的周进行排列,我正在尝试从该网站 https://odibets.com/league...

回答 2 投票 0

没有名为 Selenium 的模块;已经满足要求了

终端错误 安装错误 我正在尝试运行一个简单的测试程序来使用 Selenium 打开一个窗口。不幸的是,我不断收到一条错误消息,说没有名为 selenium 的模块。什...

回答 2 投票 0

如何使用selenium访问svg对象内的元素

我正在尝试使用 Selenium 从 OpenStreetBrowser 访问速度数据,但无法访问网站的 SVG 元素。 这是我到目前为止所尝试过的 从硒导入网络驱动程序 来自瑟伦...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.