lxml 相关问题

lxml是一个功能齐全的高性能Python库,用于处理XML和HTML。

来自lxml python的fromstring函数出错

试图导入lxml.etree xml_str =“”“ 香港,2020年2月6日- •仅测试数据 ...

回答 1 投票 -1

for循环中的变量将成为外部循环Python的新迭代器

假设我有以下示例代码:element = xmlDoc.find(“ ...”)#这返回一个在XML文档中为element.getchildren()中的child元素找到的元素:#遍历每一个...

回答 1 投票 0


从单元测试Python解析XML文件

我正在尝试使用某些方法来编写一些单元测试,这些方法可以解析XML的不同元素。但是我在单元测试中解析“测试” xml文件时遇到了一些问题。我的问题不是很多...

回答 1 投票 0

如何使用lxml从XML检索xsi:noNamespaceSchemaLocation?

我正在尝试基于xsi:noNamespaceSchemaLocation验证XML。我研究了这个问题,但似乎没有任何可用的解决方案。我的XML文件是这样的:

回答 1 投票 0

如何使用lxml从xpath获取所有文本

我目前具有以下u ='https://www.cruiseplum.com/search#{%22numPax%22:2,%22geo%22:%22US%22,%22portsMatchAll%22:true,%22numOptionsShown% 22:100,%22ppdIncludesTaxTips%22:true,%22uiVersion%22:%...

回答 1 投票 0

lxml中的命名空间

我想使用lxml包创建以下XML:

回答 1 投票 0

python lxml在某些情况下无法解析日文[重复]

我正在使用lxml 4.5.0从网站抓取数据。它在以下示例中效果很好chrome_ua =“ Mozilla / 5.0(Macintosh; Intel Mac OS X 10_13_6)AppleWebKit / 537.36” \“(KHTML,...

回答 1 投票 1

lxml如何定位和检索多个元素值?

请考虑以下HTML: 标题1 苹果 ...

回答 3 投票 1

从XML获取xsi类型-Python

我有以下“ test.xml”文件:

回答 1 投票 1

从带有注释的XML中删除名称空间-Python

此问题是此答案的后续内容:https://stackoverflow.com/a/51972010/3480297我正在尝试从XML文件中删除名称空间。没有评论时,链接的答案可以正常工作...

回答 1 投票 1

在lxml中按名称空间查找

我有一个xml文件,其中的元素看起来像gnc:account(这是一个gnucash帐户文件)。我想找到所有具有该名称的元素。但是,如果我这样做;用于tree.iter('gnc:...

回答 2 投票 0

改善node.xpath('//')

我发现自己正在做下面的事情,以找到可能出现在多个xpath上的一个节点,但是该节点本身只会出现一次:node.xpath('// Parent')这将搜索...中的所有路径。

回答 1 投票 1

将lxml _Element转换为HtmlElement

出于各种原因,我试图从lxml.html.fromstring()切换到lxml.html.html5parser.document_fromstring()。两者之间的最大区别是,第一个返回的是lxml.html ....

回答 1 投票 9

无法找到beautifulsoup解析器中已经存在的数据

我正在从newegg网站上抓取产品详细信息。我试图从右侧边栏刮掉价格。在汤中,以lxml格式存在(请参见图1),但是当我尝试使用...

回答 1 投票 -1

如何使用lxml和iterlinks替换链接

我是lxml的新手,我试图弄清楚如何使用iterlinks()重写链接。为html.iterlinks()中的元素,属性,链接和pos导入lxml.html html = lxml.html.document_fromstring(doc):...

回答 4 投票 6

如何打印lxml树元素的XPath?

我正在尝试打印XML树中所有元素的XPath,但是使用lxml时会得到奇怪的输出。代替包含路径中每个节点名称的xpath,我得到了奇怪的“ *”类输出。做...

回答 1 投票 0

tree.xpath返回空列表

我正在尝试编写可以抓取给定网站的程序。到目前为止,我是这样的:从lxml导入html导入请求页面= request.get('https://www.cruiseplum.com/search# {“ numPax”:2,“ geo”:...

回答 2 投票 0

尝试使用Python 3解析XML文件

希望大家都能帮助我。我对python比较陌生。我有需要在Powershell中工作的东西,但是通过Powershell对象访问XML元素比Python要容易得多...

回答 1 投票 1

硒和lxml-如何设置html?

我有一个脚本,可以分析文档并使用lxml更改表单值。现在,我想使用硒导航到页面并执行此操作。不幸的是硒似乎还不够先进...

回答 1 投票 -1

© www.soinside.com 2019 - 2024. All rights reserved.