beautifulsoup 相关问题

Beautiful Soup是一个用于解析HTML / XML的Python包。此软件包的最新版本是版本4,导入为bs4。

Python - 使用HTML标记进行Web抓取

我正在尝试抓取一个网页列出URL中发布的作业:https://careers.microsoft.com/us/en/search-results?ur = l-hyderabad有关网页的详细信息,请参阅图像检查Web检查......

回答 1 投票 0

使用BeautifulSoup4从HTML中提取字段

我第一次使用BeautifulSoup4,并且遇到了必须简单明了的事情。我有一个Element Tag,看起来像这样: \n ...

回答 1 投票 0

使用Python 3和beautifulsoup4解析HTML表

所以我有HTML表格,我已经解析了数据,我在控制台中打印出来。 HTML代码: Station ...

回答 2 投票 0

使用美丽的汤刮痧多个URL

我有一个数据框,其中一列包含超过4000个不同的文章URL。我已经实现了以下代码来从URL中提取所有文本,它似乎适用于一个...

回答 1 投票 0

python web抓取代码不会打开链接

这是“用python自动化无聊的东西”一书。起初我创建了一个.bat文件并使用cmd中的参数运行它,没有打开chrome中的任何页面,在这里查找,更改了代码,...

回答 2 投票 1

想通过使用BeautifulSoup从雅虎财务中检索股票公司名称

我试图使用BeautifulSoup废弃股票公司名称,但结果“IndexError:list index out of range”出现。 Belows是我的代码来自bs4 import BeautifulSoup list = ['BABA',...

回答 2 投票 -1

如何从数组中获取数字

[ ‐ Help With Steam Workshop

回答 2 投票 0

网页刮刮Python BeautifulSoup

我只是Python的初学者。我试图从网站上抓取数据并设法编写下面的代码。但是,我不知道如何继续前进,因为我无法获得href标签...

回答 3 投票 1

BeautifulSoup4搜索标签由文本正则表达式

我有这两个场景,我想使用正则表达式通过文本搜索标签。汤= BeautifulSoup(“TEXT ", "...

回答 1 投票 0

Python:如果XML标签不存在,我需要打印'Blank'和Output

忽略以下文本段落XML代码,万维网联盟(W3C)的正式建议类似于超文本标记语言(HTML)。 XML和HTML都包含标记符号......

回答 1 投票 0

如何使用python和beautifulsoup4循环和抓取多个页面的数据

我必须迭代超过4000页:在每页之后。当我们到达可用的最后一页时,没有更多的页面,所以我们已经完成并可以退出循环,例如持续。可能没有......

回答 1 投票 0

我美丽的汤刮刀没有按预期工作

我试图从以下网页中提取成分列表:https://skinsalvationsf.com/2012/08/updated-comedogenic-ingredients-list/所以我要拉的第一个成分是......

回答 2 投票 1

使用python(自定义网址)下载bing图像搜索结果

我想使用python代码下载bing搜索图像。示例网址:https://www.bing.com/images/search?q = sketch%2520using%20iphone%2520students我的python代码生成一个bing搜索网址为...

回答 1 投票 -1

解析BeautifulSoup,错误消息TypeError:强制转换为Unicode:需要字符串或缓冲区,找到NoneType

所以我正试图抓取一个亚马逊页面的数据,当我试图解析卖家所在的位置时,我收到了一个错误。这是我的代码:#getting the html request = urllib2.Request('http:// www ....

回答 1 投票 3

刮取网址的CSV列表并将结果输出到不同的CSV

我试图从'YP_LA_Remodel_urls.csv文件中提取网址(我在下面包含了几个),抓取它们,然后将结果导出到Yp_LA_Remodel_Info.csv。如果我拿一个网址(不是来自csv)和......

回答 1 投票 0

脚本在解析链接时给出重复的结果

我正在尝试使用以下脚本从网页抓取图像链接,但是当我运行它时,脚本从那里获取两个链接(相同的链接两次)。为什么我会得到如此奇怪的结果?我需要 ...

回答 2 投票 1

BeautifulSoup:获取文字,创建字典

我正在搜集中央银行研究出版物的信息,到目前为止,对于美联储,我有以下Python代码:START_URL ='https://ideas.repec.org/s/fip/fedgfe.html'page = ...

回答 2 投票 2

使用Python中的BeautifulSoup解析多个项目

我正在尝试从网站解析HTML,其中有多个元素具有相同的类ID。我似乎无法找到解决方案;我设法得到一个项目但不是全部。这里有点......

回答 1 投票 0

美丽的汤(代码工作)现在只返回某些标签

几个星期前我正在抓取这个网站,但有些代码不再适用。此代码按预期返回所有内容:来自bs4 import BeautifulSoup导入请求url ='https:// www ....

回答 1 投票 0

具有相同类的div的Beautifulsoup打印属性值

我有以下代码工作,将在value = soup = BeautifulSoup(html,'lxml')之后打印文本name = soup.find('input')['value'] print(name)但页面有多个div ...与......

回答 1 投票 -1

© www.soinside.com 2019 - 2024. All rights reserved.