beautifulsoup 相关问题

Beautiful Soup是一个用于解析HTML / XML的Python包。此软件包的最新版本是版本4,导入为bs4。

用BeautifulSoup刮Instagram

我正试图从Instagram中的“按标签搜索”中获取特定字符串。我想从这里获取url img:

回答 1 投票 0

Web抓python(beautifulsoup)多页和子页面

我创建我的汤:导入pandas作为来自bs4的pd导入请求导入BeautifulSoup导入os导入字符串为i in string.ascii_uppercase [:27]:url =“https://myanimelist.net/anime.php?...

回答 1 投票 0

从表中刮取数据并将其存储在csv文件中

我想废弃这个网站上的数据,并以这种方式将其存储在csv文件中。但是当我试图废弃数据时,它并没有以精确的格式存储。所有数据都存储在第1栏中......

回答 2 投票 -1

Webscrape应用程序找不到正确的HTML容器

这是我的第一个webscraping应用程序类型。这是我的代码:从urllib.request import urlopen导入bs4作为uReq从bs4导入BeautifulSoup作为汤my_url ='https://www.newegg.com/Video -...

回答 1 投票 0

试图通过使用soup.select和soup.find_all来提取URL

这是网页HTML源代码的一部分:

回答 3 投票 1

如何仅使用BeautifulSoup和Python删除包含空格的HTML标记

我一直试图抓取一些HTML并从中提取某些文本。 HTML包含空标记或仅包含空格的标记。如何摆脱树上的所有标签?一世 ...

回答 1 投票 0

在Python中导入BeautifulSoup时出错

使用from bs4 import执行脚本BeautifulSoup会出现以下错误:Traceback(最近一次调用最后一次):文件“C:\ Users \ Stewart \ Desktop \ dorkscan.py”,第13行, ...

回答 1 投票 0

TypeError:'ResultSet'对象不可调用 - 带有BeautifulSoup的Python

这里是python的新手,并且在尝试设置一些代码来从网页列表中删除数据时仍然遇到错误。其中一个页面的链接是 - https://rspo.org/members/2.htm,我...

回答 1 投票 -1

Python Web-scraping多页表到csv和DF进行分析

当我尝试浏览网页时,它只从第10页到csv文件的表格,我想将每个页面的结果发送到文件。我知道我可能很容易......

回答 1 投票 0

Python:告诉BeautifulSoup从两个中选择一个值

我正在使用BeautifulSoup抓取一个值,但输出给了我两个值,因为它在页面上是两次,我该如何选择其中一个?这是我的代码:url ='URL'r = requests.get(url,...

回答 2 投票 0

从字符串中删除html图像标记及其间的所有内容

我已经看到了一些关于从字符串中删除HTML标记的问题,但我仍然不清楚应该如何处理我的特定情况。我看过很多帖子建议不要使用常规...

回答 3 投票 7

从中提取文本 元素结束 分子

我正在使用BeautifulSoup编写一个脚本来从中提取文本 要素;它运作良好,直到遇到一个 包含的元素 标签,在这种情况下,它只捕获...

回答 2 投票 0

如何解析不同的标签数据并单独存储?

我正在尝试从以下网站分别解析class:fixture_date和class:play_team。 http://www.espncricinfo.com/ci/content/series/1128817.html?template=fixtures。代码:import re ...

回答 2 投票 1

更新for循环中的列表和词典时出现问题

来自selenium的导入webdriver来自selenium.webdriver.firefox.options导入选项导入bs4 import datetime导入时间#options =选项()#options.add_argument(“ - headless”)#driver = ...

回答 2 投票 0

Python:AttributeError:'ResultSet'对象没有属性'get'

当我尝试从网站中抓取一个值并将其放入有效负载请求时,我收到错误:AttributeError:'ResultSet'对象没有属性'get'这是我的代码:resumeURL ='url'response = ...

回答 2 投票 0

使用BeautifulSoup在HTML注释中的标签内提取文本

我想在没有list标签的注释中的list元素中提取文本。但是我不能用下面的代码来完成它。来自bs4 import BeautifulSoup,评论html =“”“

回答 2 投票 0

即使通过代理连接失败,如何重试当前循环

所以我想要废弃一堆链接,但经常发生的是在循环中间(当试图连接到随机链接时),突然通过代理连接失败,...

回答 1 投票 1

在Python中使用BeautifulSoup找不到HTML表

我一直在尝试从以下URL解析HTML表格(http://www.bmfbovespa.com.br/pt_br/servicos/market-data/consultas/mercado-de-derivativos/precos-referenciais/taxas-referenciais -bm -...

回答 1 投票 0

BeautifulSoup4文档示例不起作用

我是BeautifulSoup4的新手并且非常集中地学习它。问题在于下一段代码(我在页面https://www.crummy.com/software/BeautifulSoup/bs4/doc / ...的文档中找到了它。

回答 2 投票 -1

使用Beautiful Soup 4提取特定列表项

我试图从这个网页中提取“余额”整数值,但我很难搞清楚如何隔离该列表项。这是我目前的代码:import bs4,request res = ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.