lxml 相关问题

lxml是一个功能齐全的高性能Python库,用于处理XML和HTML。

从嵌套的xml文件创建pandas数据帧

这是xml文件的一小部分。我想从这里创建一个数据库,每个标签都有唯一的列名和非重复数据。尝试使用lxml和我能做的最好的...

回答 1 投票 1

字符串的python lxml xml.etree.ElementTree.Element将不会转换

键入(ikePanProfiles) etree.tostring(ikePanProfiles)Traceback(最近一次调用最后一次):文件“”,第1行,in ...

回答 1 投票 1

网页搜索电话号码

首先,我是编程的新手,我的英语不是最好的。我在Windows 10 Pro上使用Python 3.6。经过一些试验和错误,我终于找到了如何从...中废弃数据

回答 1 投票 2

如何使用cssselect和lxml从select下拉列表中获取选项值?

我想使用lxml和cssselect从选择下拉框中获取/抓取数据。到目前为止,我已经尝试了一些东西并在网上搜索没有运气:所以我在页面上的以下或类似的代码...

回答 2 投票 1

lxml截断包含“小于”字符的文本

>>> s =' < 20 ' >>> import lxml.html >>> tree = lxml.html.fromstring(s) >>> lxml.etree.tostring(tree) ' ' Does ...

回答 2 投票 5

从HTML中的script元素内部提取对象键的值

window.realty = {"user_id":4243456}; <!--window.agency = < %- JSON.stringify(agency) % >;-...

回答 3 投票 2

如何使用python调整xml文件中的时间序列数据

有没有一种使用python从xml文件更改数据的简单方法?在我的例子中,我有一个包含许多时间序列的大型xml文件,看起来像;

回答 1 投票 2

为什么lxml.etree.iterparse()占用了我所有的记忆?

这最终消耗了我所有可用的内存,然后该进程被终止。我已经尝试将标签从计划更改为“较小”标签,但这并没有什么区别。我究竟做错了什么 /...

回答 3 投票 18

如何释放lxml.etree使用的内存?

我正在使用lxml.etree从一堆XML文件中加载数据,但是一旦我完成了这个初始解析,我想关闭它们。目前,以下代码中的XML_FILES列表占用了350 MiB的...

回答 4 投票 6

LXML问题在Python 3中解析XML模式

我正在尝试使用XRDTools库将Panalytical XRDML文件转换为更加数据库友好的格式,例如pandas数据帧。这里描述了XRDTools库:https:// github ....

回答 1 投票 0

Python - 大型XML到JSON到文件/ RAM和交换过载

我目前正致力于通过OpenStreetMaps省/州转储创建一种Pythonic解析方式;据我所知,只知道如何处理非常大的XML文件(对吧?)。我......

回答 2 投票 2

Python 3使用lxml编写大型(300+ mb)XML

我一直在谷歌搜索过去几天,但我根本找不到任何远程类似问题:(我在Python 3中的脚本有一个简单的目标:连接到MySQL数据库并获取数据创建XML与...

回答 1 投票 0

如何通过lxml XPath从HTML中提取img src?

我正在尝试使用python / lxml和xpath()命令提取图像URl,但是在隔离url本身时遇到了问题。这是我想要的img src的HTML:

回答 2 投票 0

lxml xpath无法导入名称etree

在这个lxml xpath教程之后使用Ubuntu 14.04 https://www.youtube.com/watch?v=PgWfF-Ut0zM更新了这个下载pip上游版本的lxml https://stackoverflow.com/a/33089634 ...

回答 1 投票 1

如何使用lxml获取XML声明字符串

我使用lxml来解析XML文档如何获取声明字符串?我想检查它是否存在,它具有什么编码以及xml版本。

回答 2 投票 1

我如何使用lxml和python遍历 of a html document along with its children

我想拿一个HTML文档并遍历 part of the document with its children. I see lots of examples to get a subtree via xpath or tag name but this doesn't seem to give ...

回答 2 投票 0

无法使用我的scraper中定义的xpath获取项目

我试图创建两个xpath来从一些元素中获取两个项目。然而,第一个是伟大的,但在第二个:我无法得到任何想法。任何有关这方面的帮助将不胜感激。

回答 1 投票 1

lxml - 从间接url转换为direct url

我使用python和lxml来收集一些网络数据。如果我有一些元素:从lxml导入请求导入html r = requests.get(url)tree = html.fromstring(r.text)file_ = tree.xpath('some_xpath'...

回答 1 投票 0

Python:如果XML标签不存在,我需要打印'Blank'和Output

忽略以下文本段落XML代码,万维网联盟(W3C)的正式建议类似于超文本标记语言(HTML)。 XML和HTML都包含标记符号......

回答 1 投票 0

美丽的汤(代码工作)现在只返回某些标签

几个星期前我正在抓取这个网站,但有些代码不再适用。此代码按预期返回所有内容:来自bs4 import BeautifulSoup导入请求url ='https:// www ....

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.