lxml 相关问题

lxml是一个功能齐全的高性能Python库,用于处理XML和HTML。

Python lxml和字符串编码问题

我正在使用lxml从html文档中提取文本,但我无法从文本中获取某些字符以进行正确呈现。这可能是愚蠢的事情,但我似乎无法找出解决方案……这是一个...

回答 2 投票 0

使用Scrapy检测表单(并将其填充)

我正在努力寻找一种通用方法来检测HTML中的表单然后提交。当预先知道给定页面的页面结构时,我们当然有几个选择:-...

回答 2 投票 1

与在venv中安装lxml有关的问题,

我正在尝试使用pip设置evalai-cli,但是在尝试运行pip时在安装过程中遇到问题install evalai在库libxml2中找不到函数xmlCheckVersion。是否已安装libxml2?...

回答 2 投票 0

Python:lxml并非一直都在读取元素文本

我想将具有以下结构的xml文件加载到pandas数据框中,xml的大小可能在1 GB到6GB之间。xml示例下面只有5条记录,但是我的实际文件将有大约100000 ...

回答 1 投票 0

如何在Python中将ElementTree写入文件对象?

我有一个XML文件,需要将其发送到某些URL。我这样做是这样的:data = {'file':open('test.xml','rb')} req = requests.post(URL,files = data)可行,但是问题是我首先需要。 ..

回答 1 投票 0

如何从python的xml文件中读取数据

我下面有xml文件数据: [[[6168 ...]]]

回答 2 投票 -1

使用lxml查找隐藏元素

im试图找到一种从隐藏元素中获取“值”文本的方法。您还需要考虑编码方面的问题,并且要具体回答:D im使用python和lxml,这是...

回答 1 投票 0

将xml源中的实体输出到有效的html

我正在尝试将某些xml的内容转换为html实体。我想将实体内容输出为有效的html。 xml就是这样。. ] ] >>

回答 1 投票 0

使用Python和lxml从HTML删除类属性

问题如何使用python和lxml从html删除类属性?示例我有: Lorem ipsum dolor sit amet,consectetur adipisicing elit 我要:&...

回答 3 投票 16

XPath:选择第一个Div属性匹配条件的后代所有文本

请考虑以下代码: 123 456 ABC ... ]

回答 1 投票 0

使用beautifulsoup抓拍merriam-webster

我正在使用beautifulSoup,并尝试仅从merriam-webster中抓取单词的第一个定义(非常冷),但同时也抓取了第二行(一个句子)。这是我的代码。附言:我只想要...

回答 2 投票 0

无法在Windows 7上安装lxml

我知道关于如何安装lxml的问题很多,我已经按照我发现的所有步骤进行了操作(下面将详细介绍)。但是,考虑到我所做的一切,我最终将无法...

回答 2 投票 1

使用Python从加载的XML文件中获取XML文件名

我的Python代码读取存储在该位置的XML文件,并使用lxml库解析后将其加载到Python列表中,如下所示:XMLFILEList = [] FilePath ='C:\\ plugin \\ TestPlugin \\'XMLFilePath = ...] >

回答 1 投票 1


使用Python创建文件时保留初始XML注释

我的Python代码将下面的内容存储在SQL Server中的XML文件中,并使用Print(result)语句代码显示了相同的XML文件存储在SQL Server中。 SQL Server中的XML文件: ]

回答 1 投票 1

将BeautifulSoup汤转换为lxml元素

我想使用BeautifulSoup或lxml来解析某些网页。由于原始数据不是干净的xml,因此lxml.etree.fromstring无法直接对其进行解析。但是,Beautifulsoup(page_source,'...

回答 1 投票 1

lxml无法在python 3.7中安装

我无法在我的python env中安装libxml来安装sofort python:Python 3.7.3已经做到了:apt-get --reinstalll install python-dev libxml2-dev libxslt1-dev zlib1g-dev尝试安装libxml时...] >

回答 1 投票 0

使用beautifulsoup提取长属性值

再次编辑,确定,我需要解析一些网站,您能帮我解析这个怪异的东西吗?

回答 1 投票 0

如何从HTML页面但从元素本身提取或剪贴数据

当前,我使用lxml解析html文档以从HTML元素获取数据,但是存在一个新的挑战,其中一个数据作为等级存储在HTML元素https://i.stack.imgur ....] >

回答 1 投票 0

如何在python lxml中加快xbrl文件的解析速度?

我正在尝试通过arelle解析xbrl文件(1.35Gb)。在调试期间,我发现执行保持在ModelDocument.py:157行上。它保持超过30分钟。 Python进程大约需要8Gb RAM,并慢慢地...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.