beautifulsoup 相关问题

Beautiful Soup是一个用于解析HTML / XML的Python包。此软件包的最新版本是版本4,导入为bs4。

从动态页面提取完整评论和评级时遇到问题

我想从网站上抓取提取数据: https://www.kununu.com/de/adidas/kommentare 但是,当我尝试通过 webdriver 提取整个 HTML 代码时,某些数据未提取。 失踪的达...

回答 1 投票 0

Headless chrome 和 html 解析器字符串

我目前正在使用 selenium 和 BeautifulSoup 来抓取网站,但我遇到了两个主要问题,首先,我无法让 Chrome 以无头模式启动,并且它说有多个

回答 2 投票 0

AttributeError:当从 html 中按名称提取值时,“str”对象没有属性“text”

这里是我的 html,它是我的一个 API 调用的响应正文的一部分,我想从中提取 SAMLResponse 值。 这是我的 html,它是我的一个 API 调用的响应正文的一部分,我想从中提取 SAMLResponse 值。 <html> <head> <meta charset="utf-8" /> </head> <body onload="document.forms[0].submit()"> <noscript> <p> <strong>Note:</strong> Since your browser does not support JavaScript, you must press the Continue button once to proceed. </p> </noscript> <form action="https://idpftc.fortinet.com/saml/Gy736KPK3v1aWDPECRZKAn/logout/" method="post"> <input type="hidden" name="SAMLRequest" value="GV4Pjwvc2FtbHA6TG9nb3V0UmVxdWVzdD4K"/> <input type="hidden" name="RelayState" value="id-1jrGp3Fx271D7u3st|1709777499|c6ec46798457a5bb990b5c8e8a90bf34c6b55156"/> <noscript> <input type="submit" value="Continue"/> </noscript> </form> </body> 这是我尝试进行提取的Python代码。 from bs4 import BeautifulSoup def getSamlResponse(resp): soup = BeautifulSoup(resp.text, 'lxml') return soup.find('input',attrs = {'name': 'SAMLResponse'})['value'] resp = '<html code here>' print(getSamlResponse(resp)) 但是我遇到了这样的失败: File "<stdin>", line 1, in <module> File "<stdin>", line 2, in getSamlResponse AttributeError: 'str' object has no attribute 'text' 有什么想法可能是错的吗? 杰克 由于变量 resp 已经是一个字符串,因此无需在 .text 上使用 resp 属性。省略 .text 属性将删除 AttributeError。

回答 1 投票 0

使用 Beautiful Soup 抓取维基百科表,但没有返回 'None'

一般来说,是网络抓取和编码的新手。对于更有经验的人来说,这可能是一个简单的问题......也许不是......这里是: 尝试从维基百科网络抓取表格。我已经找到了...

回答 1 投票 0

无法抓取 html 中的某些文本元素

我一直在尝试使用 Beautiful Soup 网络抓取某些文本数据,但由于 HTML 代码中的格式,我似乎无法访问该文本。 我一直在尝试使用 Beautiful Soup 来抓取某些文本数据,但由于 HTML 代码中的格式,我似乎无法访问该文本。 <div class="Text__TextElement-sc-if376j-0 gYdBJW encore-text-title- small" data-encore-id="text">#1</div> '#' '1' 我想要的文字是“1”。 import requests from bs4 import BeautifulSoup def position_in_top(url): r = requests.get(url) soup = BeautifulSoup(r.content, 'html.parser') results = soup.find(id='main') job_title = results.find_all(class_ ='Text__TextElement-sc-if376j-0 gYdBJW encore-text-title-small') return job_title 这是我一直用来尝试访问它的代码。该函数返回该类的所有实例,但不包括我想要的“#”或“1”。 这应该有效。如果你的 div 有不同的类,你应该将它们放在一个列表中。 find_all 返回一个列表,并且可能返回多个 divs div_jobs = soup.find_all(class_=['Text__TextElement-sc-if376j-0', 'gYdBJW', 'encore-text-title-small']) for div_job in div_jobs: job_title = div_job.text[1:]

回答 1 投票 0

用硒和 BS4 进行刮擦

我正在尝试从这个网站上删除一张桌子作为练习 - https://stats.paj.gr.jp/en/pub/current_en_n2.html 这里的问题是,我无法打印完整的表格。这仅返回来自...的 1 个单元格

回答 1 投票 0


将星期名称更改为日期

我正在抓取一个活动网站(活动名称、日期和时间)。我在 excel 中得到的输出如下: 我想将日期名称更改为实际日期,例如星期五应该是 12.03....

回答 1 投票 0

Python tableauscraper 问题

我用来从 Tableu 仪表板检索数据的抓取工具坏了。现在,当我尝试抓取任何仪表板时,我收到相同的错误: -------------------------------------------------- ---------------...

回答 2 投票 0

BeautifulSoup 无法解析网页?

我现在正在使用 beautiful soup 来解析网页,我听说它非常有名并且很好,但它似乎不能正常工作。 这就是我所做的 导入 urllib2 从 bs4 导入 BeautifulSoup 页=

回答 5 投票 0

漂亮的汤我=只返回无[关闭]

我试图从此链接中提取信息:https://wuzzuf.net/jobs/p/EVUpYcDnxix7-Odoo-Developer-Yodawy-Med-Giza-Egypt?o=2&l=sp&t=sj&a=search-v3| HPB 试图获得工作头衔和其他

回答 1 投票 0

如何获取并点击动态加载网站的URL?

我想从链接中抓取马拉松结果(称为页面A):https://www.marathon.tokyo/2023/result/index.php 假设我在第一个选项中选择“马拉松男子”,然后搜索,...

回答 1 投票 0

从维基百科中提取信息

对于这个维基百科网站:https://en.wikipedia.org/wiki/List_of_countries_and_dependency_by_population,我将如何提取中国和印度的人口数量和百分比,尽管它们是......

回答 1 投票 0

Parsel 无法访问嵌套元素

我正在与 Parsel 合作。不幸的是,我无法解析 标签,它是另一个 标签的子标签(我知道, 中的 不是 HTML 标准)。我该如何处理...

回答 1 投票 0

使用 BeautifulSoap 库从网络获取表格时没有响应

我正在尝试从网络上获取两个数据表。我正在使用 Google Colab 的 BeautifulSoup Python 库。下载网址如下:https://www.avamet.org/mx-consulta-diaria.php?id=%%...

回答 1 投票 0

网络抓取 ESPN 预测赔率和输赢盘

我在尝试用 BeautifulSoup 废弃 ESPN 网站时总是遇到麻烦:下面是我的代码。由于某种原因,我什至无法获取要提取的团队的名称,更不用说mo...

回答 1 投票 0

第一次尝试时的美丽汤追溯

你好,我是 python 和 Beautiful Soup 的新手。我已经使用 pip install 下载了 BS4,并尝试进行一些网页扫描。我浏览了很多帮助指南,但未能得到我的

回答 2 投票 0

使用 BS4 进行 Python HTML 解析

我在尝试使用 Python 和 Beautiful Soup 解析 HTML 时遇到问题,并且遇到了我想要解析非常具体的数据片段的问题。这就是亲人……

回答 2 投票 0

在 macOS 上使用 Homebrew 安装 Python BeautifulSoup 包

我使用 Homebrew 在 macOS 上安装了 Python。现在,我正在尝试使用 BeautifulSoup,因此我执行了以下命令:brew install python-beautifulsoup4。然而,我遇到了一条消息...

回答 1 投票 0

删除部分 html(标签)保持样式 - python

我想在保存之前删除 HTML 中包含特定字符串的部分。该标签包含一个人的姓名,我想删除整个标签以使其匿名。 HT...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.