lxml 相关问题

lxml是一个功能齐全的高性能Python库,用于处理XML和HTML。

由于 lxml 的构建轮失败而无法安装 python-docx

Python版本:Python 3.12.3 macOS 索诺玛 14.4.1 我尝试安装 python-docx 并遇到以下有关 lxml 的错误消息。 收集 python-docx 使用缓存的 python_do...

回答 1 投票 0

AttributeError:模块“lxml.html.clean”在 Odoo 17 上没有属性“defs”

我在 MacBook M1 芯片的 Odor 17 项目上安装 lxml 时遇到错误。 首先,在安装requirements.txt时,出现错误。所以我注释掉了requirements.tx中的一些行...

回答 1 投票 0

使用 lxml find() 方法查找 xml 文件中的元素

我的 xml 文件长度超过 100 万行。我可以使用 BeautifulSoup 毫无问题地解析它们,但使用 bs4 进行解析可能需要一分钟或更长时间。我正在尝试使用 lxml 来完成

回答 1 投票 0

Xpath HTML 抓取不返回文本/数字 - 有用的分数

我正在使用 xpath 和 lxml 抓取评论的有用性分数。 #%% 第 1 步:导入所有扩展和包。 从 lxml 导入 html 从 urllib 导入请求 导入请求 从数据来看...

回答 1 投票 0

无法导入模块“lambda_function”:无法从“lxml”aws lambda 导入名称“etree”

我尝试使用aws lambda函数。我需要使用 lxml python 模块。 当我尝试导入时: 从 lxml 导入 html def lambda_handler(事件,上下文): 返回“好的” aws 显示一些错误。

回答 2 投票 0

Xpath HTML 抓取不返回文本/数字

我正在使用 xpath 和 lxml 抓取评论的有用性分数。 #%% 第 1 步:导入所有扩展和包。 从 lxml 导入 html 从 urllib 导入请求 导入请求 从数据来看...

回答 1 投票 0

根据多个兄弟条件选择兄弟节点值,不使用xpath字符串

使用 xpath 查找 xml 节点有多种答案,如下所示。在使用 lxml 的 python 中,是否有更 Pythonic 的方式来构建这个条件列表?我知道我可以使用...构建 xpath 字符串

回答 1 投票 0

lxml 获取没有标签的元素的文本

我正在使用 lxml 库和 python 来解析一个简单的 XML,该 XML 在本例中打印下一个元素的文本 HD,如下面的 XML 所示 有史以来最好的书...

回答 1 投票 0

如何将“用户数据”与 lxml.etree.Element 关联?

我目前正在将一些Python代码从DOM“移植”到lxml.etree,并且遇到了一个障碍:有问题的DOM代码使用Node.setUserData()和Node.getUserData API,但我找不到

回答 1 投票 0

如何在Python中获取没有值字段的textarea值

我正在尝试解析html页面并从文本区域获取值,但我无法实现它,我将放置我的代码(我从selenium开始,但它也不起作用)。我真的不明白这是哪里...

回答 1 投票 0

设置默认命名空间的前缀

我有 XML: 文字-1文字-2 我需要使用 lxml 设置默认命名空间的前缀: ...

回答 1 投票 0

类型错误:某些关键字参数意外

我正在尝试为页面编写一个解析器。我正在使用 LxmlSoup 库。 所以协议是: html = requests.get('https://www.mcdonalds.com/ua/uk-ua/eat/fullmenu.html').text 汤 = LxmlSoup(html) 网址=汤。

回答 1 投票 0

Python 中支持 XPath 2.0 的库

是否可以在Python中使用XPath 2.0函数,例如starts-with()、ends-with()和contains()?我试图使用 lxml 和 defusedxml,但不幸的是它们不支持任何这些功能......

回答 3 投票 0

无法在centos7.9上安装python 3.9的lxml包

我想在 Centos7.9 上的 Python 3.9 安装上安装 lxml 5.1.0 包 我尝试从 .targz 和 .whl 文件安装。 使用 .whl 文件时,出现以下错误消息: 错误:lx...

回答 1 投票 0

解析换行符( )在属性值中

我正在使用 lxml 库解析 xml 文档。有一个新行字符 ( )在属性值中: 从 lxml 导入 etree root = etree.fromstring(' 我正在使用 lxml 库解析 xml 文档。有一个新行字符 ( )在属性值中: from lxml import etree root = etree.fromstring('<root attr1="line1\nline2"/>') print(etree.tostring(root).decode()) 结果: <root attr1="line1 line2"/> 也就是说,解析器用空格替换换行符。有没有办法在解析时保留属性值中的换行符? 我知道您可以在创建 xml 时添加换行符: from lxml import etree root = etree.Element('root', attr1='line1\nline2') print(root.attrib['attr1']) print(etree.tostring(root).decode()) 结果: line1 line2 <root attr1="line1&#10;line2"/> 但是解析的时候怎么做呢? 我认为以下内容可以有所帮助: from lxml import etree, objectify root = objectify.fromstring('<root attr1="line1\nline2"/>') attr1_value = root.get('attr1') print(attr1_value) # Output: line1\nline2

回答 1 投票 0

使用 lxml 解析 DTD 时出错

我正在尝试编写一个验证脚本,用于根据 NITF DTD 验证 XML,http://www.iptc.org/std/NITF/3.4/specification/dtd/nitf-3-4.dtd。基于这篇文章,我想出了以下内容

回答 2 投票 0

‘/xad’出现在Python代码中的字符串列表中

首先,我是一个初学者,刚刚接触Python中级,所以请耐心等待我解决这个问题的方法。我正在使用 lxml etree 和请求开发一个网络抓取迷你项目......

回答 1 投票 0

XPath 使用超链接获取文本(Python)

我是 XPath 的新手(总的来说,我是 Python 的相对初学者)。我试图通过它从维基百科页面的第一段中取出文本。 以 Python 页面为例...

回答 2 投票 0

SAML 断言在SubjectConfirmationData 中不包含KeyInfo 元素

需要有关 SAML 断言的帮助。我们需要创建具有以下结构的主题元素:Subject>SubjectConfirmation>SubjectConfirmationData>KeyInfo>KeyValue>

回答 1 投票 0

Parsel 无法访问嵌套元素

我正在与 Parsel 合作。不幸的是,我无法解析 标签,它是另一个 标签的子标签(我知道, 中的 不是 HTML 标准)。我该如何处理...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.