lxml 相关问题

lxml是一个功能齐全的高性能Python库,用于处理XML和HTML。

从HTML标签创建一个数据框架

我试图让这个做单独的链接,然后作为日期,但我有问题与数据帧计数不匹配的arrtring找出如何合并2列表。我决定提取链接和...。

回答 2 投票 0

使用Python & lxml进行网络搜刮Strava。

我想从Strava上获取俱乐部活动的信息。我原本想使用api & C#(因为我知道),但由于api提供的信息有缺陷,我已经......

回答 1 投票 1

从纯文本中获取X路径

我试图从文本中获取xpath而不是URL。但我一直得到错误 "AttributeError: 'HtmlElement' object has no attribute 'XPath'"见下面的代码。 From lxml import html var =''''

回答 1 投票 0

获取html中的所有链接,包括条件注释中的链接。

假设我有这个简单的html。 链接1

回答 1 投票 1

Python lxml xpath find node with text()=concat('x', 'y')

我试图用python lxml xpath解析一个xml文件,结构是这样的。

回答 1 投票 0

使用Python BeautifulSouplxml刮取所有链接

http:/www.snapdeal.com 我试图从这个网站上刮取所有链接,当我这样做时,我得到一个意想不到的结果。我发现这是因为javascript的缘故,在 "查看所有 ...

回答 6 投票 1

替换特定的XML属性值

我在网上查了一下,但我找不到问题的答案。我需要替换一个XML文件属性值,如果它是size="10.439 "到size="10.238"。基本上,我需要改变这个...

回答 2 投票 -1

lxml xpath - 找不到body标签。

我想在Calibre中写一个插件,检查epub文档中的脚注(基本上是寻找字体大小<某个值)。我需要获取html文件中所有的子标签(在html文件中的

回答 1 投票 0


如何过滤没有utf-8的HTML,得到一个utf-8的HTML?

http:/www.jcpjournal.orgjournalview.html?doi=10.15430JCP.2018.23.2.70 如果我使用下面的python代码来解析上面的HTML页面,我将得到UnicodeDecodeError。 from lxml import html doc = ...。

回答 1 投票 0

在python中无法使用XPATH获取文本值。

我想从这个银行网站解析货币。在代码中: import requests import time import logging from retrying import retry from lxml import html logging.basicConfig(filename='info.log', ...

回答 3 投票 0

在Python中插入lxml树的属性错误。

我试图将一个小的xml结构注入到一个已经存在的xml文件的特定位置。 Y 我的代码...

回答 1 投票 0

使用Python创建具有特定顺序或属性的XML文件。

我试图使用lxml创建一个xml文件,我很清楚xml中属性的顺序并不重要,但我仍然在寻找一种方法来防止属性按特定顺序排列。I ...

回答 1 投票 0

如何用python提取有条件的节点信息到兄弟节点的信息?

我有一个带有personIdof interest的列表: agents = {'id': ['20','32','12']} 然后我有一个XML文件,里面有家庭特征。

回答 1 投票 1

如何在XML文件中的CDATA前后添加空格。

我想创建一个函数来修改XML内容而不改变格式。我设法改变文本,但我不能不改变XML的格式。所以现在,我想做的是添加......

回答 1 投票 0

Python lxml 如何撤销 addnext()

我在Python中使用lxml进行网页抓取。当找到一个我认为有用的标签时,我用以下命令标记它: myelement.addnext(etree.XML("

回答 1 投票 0

用lxml替换xml元素。

我有一个复杂的xml文件,我们需要动态更新其中的一些元素。我已经成功地能够使用lxml更新值字符串(属性),但我完全不知道如何去......

回答 1 投票 0

导入错误。没有名为lxml.etree的模块

我试图在我的项目中导入premailer,但在导入etree时一直失败。我安装了lxml的2.7二进制文件。lxml模块导入得很好,而且它显示了正确的路径到 ...

回答 6 投票 5

用Python、BeautifulSoup进行网络搜刮。

我在用Python解析链接的时候遇到了问题,我的代码是:def get_content(html) 这是我的代码: def get_content(html): soup = BeautifulSoup(html, 'lxml') items = soup.find_all('div', class_='grid-item___eaXVb') for ...

回答 1 投票 0

为什么用 lxml 写完一个 XML-file 后,属性值中的非 ASCII 字符会被转义?

我试图用python和来自lxml的etree.xmlfile持续构建一个xml-file。我的输入是一个XML文件,其中的属性值有umlauts。我用lxml读入这个文件,做一些......。

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.