lxml 相关问题

lxml是一个功能齐全的高性能Python库,用于处理XML和HTML。

<?xml version=“1.0” encoding=“UTF-8”?> 不是<?xml version='1.0' encoding='UTF-8'?>

我正在使用 lxml tree.write(xmlFileOut, Pretty_print = True, xml_declaration = True, 编码='UTF-8' 写出我打开和编辑的 xml 文件,但我绝对需要 xml 声明...

回答 3 投票 0

如何获取lxml中元素的路径?

我正在使用Python中的lxml中的XPath在HTML文档中进行搜索。如何获取某个元素的路径?这是 ruby nokogiri 的示例: page.xpath('//text()').each 做 |textnode| ...

回答 4 投票 0

如何在Cygwin下的Python 3.8中安装lxml?

我一直在尝试在Cygwin上使用pip install安装Python3.8下的cython和lxml包。然而,这会反复失败,并出现从 python 错误到 gcc 错误等难以理解的错误

回答 2 投票 0

如何在迭代编写时强制缩进 python LXML xml 元素嵌套?

我正在使用 LXML 编写一个 xml 文件,该文件是数据库的转储。 鉴于数据的大小,我必须反复编写 xml 文件。将 etree 转储到文件时,服务器内存不足

回答 0 投票 0

循环不是抓取多个页面,只是重复从一个页面返回数据

进口请求 从 bs4 导入 BeautifulSoup 将熊猫导入为 pd headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari...

回答 0 投票 0

openpyxl:在没有 zipfile 的情况下获取工作表的 xml 源代码

从 openpyxl 导入 load_workbook wb = load_workbook('file.xlsx') ws = wb['Sheet1'] 有没有办法检索表示 ws 对象的 xml 代码? 注意:我想避免使用 zipfile ...

回答 1 投票 0

关于美汤4模块的问题

我很困惑,因为这段代码有时有效,有时无效。该代码基于美丽的汤模块。我想知道为什么它在某些情况下有效以及为什么它在其他情况下无效...

回答 2 投票 0

不能在带有 lxml etree 的 xpath 中使用 translate() 方法

我想使用 Python 中的 lxml 库翻译来降低我的文本。我的代码如下 r = element.xpath('./a/translate(text(), "A", "a")') 但它给了我一个例外: lxml...

回答 1 投票 0

XML : lxml.etree - findall() when document element has attributes

.findall() 在文档元素具有属性时找不到任何内容。为什么会出现这种行为以及如何解决? 这是代码: 从 lxml 导入 etree as et 文本 = '''\ .findall() 当文档元素具有属性时找不到任何内容。为什么会出现这种行为以及如何解决? 代码如下: from lxml import etree as et text = '''\ <svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink">\ <text class="what1 y2">abc</text><text class="what17 x1">nbc</text>\ <text class="f18 sf4 f12" textLength="72.18">ID_NUM.47</text></svg>''' tree = et.fromstring(text) for elem in tree.findall(".//text"): if elem.text == "ID_NUM.47": elem.getparent().remove(elem) print(et.tostring(tree)) tree.findall(".//text") 返回一个空列表。 但是对于以下文档,其中删除了svg标签属性,找到了所有元素: text = '''\ <svg><text class="what1 y2">abc</text><text class="what17 x1">nbc</text>\ <text class="f18 sf4 f12" textLength="72.18">ID_NUM.47</text></svg>''' 此外,例如,当用 .findall() 替换 .xpath('//*[attribute::textLength]') 时,所有元素都在两个文档中找到。

回答 0 投票 0

在 Python 中键入提示保护/私有类的正确方法?

我这里有一个示例类,我想使用 lxml 来解析 xml 文件。 XML 解析器类: def __init__(自我,路径:海峡): self.root: etree._Element |无 = 无 然而,PyCharm

回答 1 投票 0

Mypy 函数“lxml.etree.ElementTree”作为类型无效,但为什么呢?

我正在使用 Mypy 来实现这个功能 将函数导入为 fu 从 lxml 导入 etree 从 lxml.etree 导入元素,ElementTree def find_nodes(tree: ElementTree, paths: Iterable[str]) -> Iterable[Eleme...

回答 2 投票 0

尝试使用 Pandas 并不断收到此错误:错误:lxml 的构建轮失败

我正在尝试使用 Pandas 从网络上获取表格我遇到的第一个错误是“找不到 lxml,请安装它”,通过终端安装后,我不断得到...

回答 1 投票 0

如何将 spaCy 模型结果附加到 XML - 需要 XSLT 或 Python 脚本而不损坏标签

我将此 JSON 数据附加到下面的 xml 中: { “para-num”:31, “ele-id”:“71FCC3AE”, “转换标签”:“段”, &quo...

回答 0 投票 0

如何使用 `lxml` 将所有出现的标签更改为特定文本?

我自制的解决方案可能是: 将 lxml.etree 导入为 ET def tag2text(节点,sar): """将 `sar.keys()` 中的元素替换为 `sar.values()` 中的文本。""" 对于 elem, tex...

回答 2 投票 0

如何在 Pycharm 中安装 lxml?

我对 Python 比较陌生。我正在尝试使用 BeautifulSoup 来抓取网站并想要运行代码: 来源 = requests.get(URLHERE).text 文章 = BeautifulSoup(来源,“lxml”) R...

回答 2 投票 0

XML 和可能的 LXML 问题

我有很多这样的 XML 文件 1808 ...

回答 2 投票 0

在 M1 mac 上安装 lxml 的问题

所以,我遇到了安装 lxml 的经典问题。 最初我只是 pip 安装,但是当我尝试使用 Element.clear() 释放内存时,我收到以下错误: Python(58695,0x1001...

回答 6 投票 0

在 Windows 中安装 lxml 的问题

C:\Users\home>pip install lxml 收集 lxml 使用缓存的 lxml-4.9.2.tar.gz (3.7 MB) 准备元数据(setup.py)...完成 为收集的包构建轮子:lxml 建筑轮...

回答 0 投票 0

BeautifulSoup - lxml 和 html5lib 解析器抓取差异

我正在使用 BeautifulSoup 4 和 Python 2.7。我想从网站中提取某些元素(数量,请参见下面的示例)。出于某种原因,lxml 解析器不允许我提取...

回答 2 投票 0

仅当 XML 元素使用 Python 和 XPath 显式定义任何默认命名空间时才获取它们

我正在用 Python 解析一个 XML 字符串,我正在寻找一个 XPath 表达式来只检索明确定义任何默认命名空间的元素(xmlns,没有前缀)。 我正在和...一起工作

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.