lxml 相关问题

lxml是一个功能齐全的高性能Python库,用于处理XML和HTML。

如何通过lxml XPath从HTML中提取img src?

我正在尝试使用python / lxml和xpath()命令提取图像URl,但是在隔离url本身时遇到了问题。这是我想要的img src的HTML:

回答 2 投票 0

lxml xpath无法导入名称etree

在这个lxml xpath教程之后使用Ubuntu 14.04 https://www.youtube.com/watch?v=PgWfF-Ut0zM更新了这个下载pip上游版本的lxml https://stackoverflow.com/a/33089634 ...

回答 1 投票 1

如何使用lxml获取XML声明字符串

我使用lxml来解析XML文档如何获取声明字符串?我想检查它是否存在,它具有什么编码以及xml版本。

回答 2 投票 1

我如何使用lxml和python遍历 of a html document along with its children

我想拿一个HTML文档并遍历 part of the document with its children. I see lots of examples to get a subtree via xpath or tag name but this doesn't seem to give ...

回答 2 投票 0

无法使用我的scraper中定义的xpath获取项目

我试图创建两个xpath来从一些元素中获取两个项目。然而,第一个是伟大的,但在第二个:我无法得到任何想法。任何有关这方面的帮助将不胜感激。

回答 1 投票 1

lxml - 从间接url转换为direct url

我使用python和lxml来收集一些网络数据。如果我有一些元素:从lxml导入请求导入html r = requests.get(url)tree = html.fromstring(r.text)file_ = tree.xpath('some_xpath'...

回答 1 投票 0

Python:如果XML标签不存在,我需要打印'Blank'和Output

忽略以下文本段落XML代码,万维网联盟(W3C)的正式建议类似于超文本标记语言(HTML)。 XML和HTML都包含标记符号......

回答 1 投票 0

美丽的汤(代码工作)现在只返回某些标签

几个星期前我正在抓取这个网站,但有些代码不再适用。此代码按预期返回所有内容:来自bs4 import BeautifulSoup导入请求url ='https:// www ....

回答 1 投票 0

解析糟糕的XHTML

我的新项目是从Naxos音乐术语词汇表中提取数据,这是一个很好的资源,我想要处理的文本数据被提取到数据库,以便在我将要创建的另一个更简单的网站上使用。 ...

回答 1 投票 0

使用POST的Flask示例

假设以下路由访问xml文件以使用给定的xpath替换特定标记的文本(?key =):@ app.route('/ resource',methods = ['POST'])def update_text(): #CODE ......

回答 3 投票 29

使用xpath和LXML或selenium从HTML表中搜索数据

我需要从这个网站从HTML表中提取数据:https://1x2.lucksport.com/result_en.shtml?dt = 2019-04-12&cid = 156我使用Python,selenium和lxml与xpath我想提取每个匹配...

回答 3 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.