beautifulsoup 相关问题

Beautiful Soup是一个用于解析HTML / XML的Python包。此软件包的最新版本是版本4,导入为bs4。

使用 python 在 Barchart.com 上自动下载文件

我想从此链接自动下载表格: https://www.barchart.com/options/iv-rank-percentile/stocks 为了做到这一点,在一些教程的帮助下,我写了这篇

回答 2 投票 0

bs4 中的 Soup.find 无法从 h1 标签中抓取,但适用于所有其他 HTML 标签

我在使用 BeautifulSoup 4 时遇到问题。我的代码运行良好,然后开始出错,无法再从 h1 标签收集内部文本。奇怪的是,它与所有功能都完美配合

回答 1 投票 0

从新闻网站提取的文本数据应该存储在哪种数据类型中以进行 NLP?

我使用 beautifulsoup 提取了以下文本数据 对于 soup2.find_all(class_="td-post-content") 中的数据: data.get_text() 我应该将上面提取的数据类型存储在哪种类型中

回答 1 投票 0

用于创建一个列,其子区域与现有列中的区域相对应

有一个列表 bareas = ['Hosa 路', 'Agara', 'Koramangala 4th block', 'Ali Asker 路', 'Singasandra'] (它是一个相当长的列表,因此仅在此处添加一些项目)。我想创建一个名为“

回答 1 投票 0

用python解析HTML+CSS时获取标签中文本大小的最佳方法是什么?

我正在使用 python 和 beautifulsoup4 抓取实时网站的 HTML 页面。我希望能够获取任何 html 标签的文本大小。我尝试使用 cssutils 解析 CSS 并找到字体大小 par...

回答 1 投票 0

如何在没有浏览器自动化框架的情况下浏览页面进行网页抓取

这是网站的网址 https://www.enterprise.com/en/car-rental.html?icid=header.reservations.car.rental-_-start.a.res-_-ENUS.NULL 所以我想在没有浏览器自动的情况下用 python 抓取这个网站...

回答 1 投票 0

网络抓取功能可通过搜索栏循环项目并返回特定关键字作为答案

有一个列表 bareas = ['Hosa 路', 'Koramangala 第四街区', 'Ali Asker 路', 'Singasandra'] (它是一个相当长的列表,所以只在这里添加一些项目)。我想创建一个函数,以便每个项目......

回答 1 投票 0

抓取网页并加载更多

我正在尝试抓取网站:每日时间。我无法抓取某个关键字的所有新闻标题和链接,例如“芭比娃娃”。 “加载更多”后我无法抓取信息。什么...

回答 1 投票 0

无法使用Beautifulsoup和Request从span标签中提取文本

我正在尝试删除此在线论坛上的帖子。 https://csn.cancer.org/categories/prostate 所有帖子似乎都在跨度标签中。 我使用下面的代码来废弃帖子。 导入请求 来自 BS4 我...

回答 1 投票 0

Python 使用请求登录困难的网站

登录并重定向到 https://www.fpl.com/northwest/my-account 后,我尝试从 https://www.fpl.com/my-account/login.html 抓取数据/能源仪表板。我已经检查过 si...

回答 1 投票 0

BeautifulSoup:超过 24 个字符(从 a 到 z)的迭代失败:降低复杂性以初步了解数据集:

我在网站上有一份西班牙保险公司名单 - 分为 24 个标题:请参阅以下内容 保险 - 西班牙语: 完整列表:https://www.unespa.es/en/directory 它分为24...

回答 1 投票 0

在Python中抓取网页时表格不出现

我发生了一件有趣的事情,但我不知道发生了什么。我正在尝试从以下位置进行网络抓取: https://www.pro-football-reference.com/teams/kan/2023_roster.htm 我想要的桌子...

回答 0 投票 0

请求获取的数据与浏览器不同

如果我尝试下载 https://www.conrad.ch/de/p/42105-lego-technic-katamaran-2255199.html 的 HTML 代码来解析价格。但是,我得到的代码与我眉毛中的代码完全不同......

回答 3 投票 0

与 BeautifulSoup 一起从公告牌热门 100 名艺术家单曲历史中抓取

我正在尝试抓取艺术家广告牌页面上的所有信息,因为这些信息与他们的单曲和他们的表演有关。我正在尝试重新设计我在其他地方看到的解决方案..它的工作效率很高...

回答 1 投票 0

如何在 Windows 上使用 BeautifulSoup 创建 Python 脚本来下载 WIkimedia Commons 文件夹中每张图片的最高分辨率?

所以,我是古斯塔夫·多雷(Gustave Doré)的忠实粉丝,我想从组织整齐的维基共享资源文件夹中下载他的所有版画。 因此,给定一个 Wikimedia Commons 文件夹,我需要下载...

回答 1 投票 0

使用物种和菌株名称、使用网络抓取(使用 BeautifulSoup 或 Selenium)难以提取 GenBank 登录号

我需要使用 BeautifulSoup 和/或 Selenium 从网页中提取特定信息。我正在尝试从网页中提取与特定生物体相关的信息,但我遇到了

回答 1 投票 0

网页抓取 Google Scholar 输出的链接比预期多,而且似乎无法过滤它们

我对Python总体来说还是个新手(大家好)。我正在尝试对 Google Scholar 进行网络抓取,到目前为止,进展相当顺利(有很多令人头疼的问题,但我正在实现目标)。我现在的问题是

回答 1 投票 0

标题:使用物种和菌株名称、使用网页抓取(使用 BeautifulSoup 或 Selenium)难以提取 GenBank 登录号

我需要使用 BeautifulSoup 和/或 Selenium 从网页中提取特定信息。我正在尝试从网页中提取与特定生物体相关的信息,但我遇到了

回答 1 投票 0

使用 python 和 beautifulsoup 进行网站表抓取返回“none”或空

我试图通过一个简单的请求从该表中抓取数据,但在尝试使用表类后,它返回“none”: table = soup.find("table", class_ = "hp") 并尝试...

回答 1 投票 0

使用 Selenium 返回正在显示的 PDF 页面

我让 Selenium 从 Google 搜索中为我打开许多 pdf 文件(使用 f"https://www.google.com/search?q=filetype:pdf {search_term}",然后单击第一个链接) 我想知道哪个...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.