beautifulsoup 相关问题

Beautiful Soup是一个用于解析HTML / XML的Python包。此软件包的最新版本是版本4,导入为bs4。

如何使用Python抓取交互式网页

我想知道如何抓取以下网站:http://chonos.ifop.cl/flow/ 该网页的右侧有一个地图,当您单击每个点时,它会显示在 Highcharts 中的左侧时间序列中

回答 1 投票 0

解析/抓取/python/requests/BeautifulSoup4。如何解析这个网站?

网站:https://www.nieruchomosci-online.pl/szukaj.html?3,mieszkanie,wynajem,,Szczecin:19503 我想解析所有广告,除了特色广告。问题是有不同的类......

回答 1 投票 0

美丽的汤找到所有点击按钮后找不到div

我正在尝试废弃这个网站。 当我尝试废弃与汽车设备网格相关的数据时,会出现此问题。我只能提取页面中已显示的元素,即使我

回答 1 投票 0

如何使用Python抓取HTML?

我正在编写一个Python脚本来从此页面抓取数据:https://www.immobiliare.it/search-list/?criterio=rilevanza&__lang=it&idContratto=1&idCategoria=1&raggio=300¢ro=45。

回答 1 投票 0

使用 Python 脚本解析 HTML 时遇到问题

我正在编写一个Python脚本来从此页面抓取数据:https://www.immobiliare.it/search-list/?criterio=rilevanza&__lang=it&idContratto=1&idCategoria=1&raggio=300¢ro=45。

回答 1 投票 0

为什么雅虎财务数据仅在我抓取时使用标题时更新?

所以,我最近学习了BeautifulSoup,并决定从雅虎财经抓取股票数据作为练习。 此处的代码仅返回股票的静态价格,该价格不会更新 导入

回答 2 投票 0

尝试测试从雅虎财经抓取的代码

我是Python初学者,但我喜欢通过测试和尝试来学习这门语言。 所以有一个雅虎网络抓取代码可以抓取特定股票的最后价格,但它对我不起作用我......

回答 2 投票 0

使用 Python 进行网页抓取,无需分页网站

我使用 Selenium 和 BS4 从网站上抓取数据并将其保存到 json 文件中。由于没有分页结构,我将网络驱动程序与selenium一起使用,但在添加selenium之前,而我的旧代码...

回答 1 投票 0

为什么BeautifulSoup无法从HTML中找到特定的表格元素?

我无法获取代码来查找比赛表格表中找到的文本(在下面的元素中突出显示)。实际获取该文本的适当元素是什么? 导入请求 从 BS4 导入

回答 1 投票 0

我在使用 BeautifulSoup 代码在网页中查找 td 类文本时遇到问题

我无法获取代码来查找比赛表格表中找到的文本(在下面的元素中突出显示)。实际获取该文本的适当元素是什么? 导入请求 从 BS4 导入

回答 1 投票 0

使用 Python BrickEconomy 网站进行数据抓取

我正在使用我编写的代码从网站“https://www.brickeconomy.com/sets/year/2024”抓取数据。我设法从表中提取乐高套装的名称,但我无法访问...

回答 1 投票 0

禁止beautifulsoup中的url警告

我正在使用 Beautiful Soup 4 来解析一些从互联网上抓取的 html 格式的文本。有时,该文本只是某些网站的链接。 BS4 非常生气的一个事实是: 用户警告:“...

回答 2 投票 0

使用Python(Selenium + BeautifulSoup)从交互式图表中提取数据

我需要从此链接中的资产演变图表中提取数据(示例):https://investidor10.com.br/carteira/572422/(附有图表图像)。我需要我存在的所有条形图的数据...

回答 1 投票 0

如何使用BeautifulSoup从HTML中抓取表格数据?

我一直在尝试从这个网站上抓取表格https://www.alphaquery.com/stock/aapl/earnings-history 但我无论如何也无法实现它。我什至找不到桌子。 导入请求 来自 BS4 我...

回答 1 投票 0

如何从 HTML 中抓取表格数据?

我一直在尝试从这个网站上抓取表格https://www.alphaquery.com/stock/aapl/earnings-history 但我无论如何也无法实现它。我什至找不到桌子。 导入请求 来自 BS4 我...

回答 1 投票 0

用硒刮痧/beautifulsoup

我一直在尝试从这个网站上抓取表格https://www.alphaquery.com/stock/aapl/earnings-history 但我无论如何也无法实现它。我什至找不到桌子。 导入请求 来自 BS4 我...

回答 1 投票 0

通过Python或其他更好的工具根据日期自动将每日更新的多个网页转换为单个pdf

我正在准备考试,这些网站会定期上传时事。 我不想每天重新打开这些多个网站,而是想通过下载来简化这个过程......

回答 1 投票 0

如何解析并提取包含::marker的标签?

所以我试图从网站上删除一些数据,并且我想提取中的文本 所以我试图从网站上删除一些数据,并且我想提取 中的文本 <ul> <li> ::marker (text) </li> <li> ::marker (text) </li> </ul> 这是我尝试过的,但没有返回其他 from bs4 import BeautifulSoup import requests url = *the link of the website page = requests.get(url) soup = BeautifulSoup(page.text, 'html.parser') reference = soup.find("li") print(reference.text) #output is None 由于有多个项目,因此可能需要使用 find_all,然后迭代这些条目,在每个项目上调用 get_text;像这样的东西: list_items = soup.find_all("li") for element in list_items: print(element.get_text()) 您可以添加一些额外的代码来检查 find_all 是否确实返回至少一个元素。

回答 1 投票 0

如何使用 bs4 从元素中提取文本

我正在抓取Airbnb(链接到下一页),我想要得到的东西之一是房东从什么时候开始托管,如下图所示(用红笔标记): 图像示例 代码...

回答 1 投票 0

通过Python获取HTML的Span类中的数据

我正在尝试从网站获取跨度类之一中的数据。目前,我捕获了数据的正确位置,但无法获取课堂文本。 我的代码: 导入请求 从 BS4 导入

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.