xml-parsing 相关问题

XML解析器遍历包含XML树的文本文档,并允许使用层次结构中的信息。将此标记用于实现XML解析器的问题,或者通过使用给定语言的现有解析器生成的问题。

XQuery 在 oXygen 中运行时能否构建并保存输出文档?

我在 oXygen 中运行 XQuery 3.1 以从输入 XML 创建输出 HTML。 在 eXist-DB 中运行 XQuery 时,可以将其中的 html 框架和 FLWOR 语句声明为变量,

回答 1 投票 0

AWS Glue - 在 Python 中捕获从 SOAP 返回的 XML 字符串并以镶木地板格式存储在 S3 中返回的 XML

我对 Python 和 AWS 很陌生。 我需要编写一个 AWS Glue 脚本来捕获通过 Python 中的 SOAP 返回的 XML 字符串,然后将此 XML 作为镶木地板格式存储在 S3 中。我写了...

回答 0 投票 0

如何获取在 Jenkins 中创建的 HTML 表值

我有一种情况,我已经为 Jenkins 参数创建了如下所示的 html 表,如果它不等于 Cu,我想在每个组件的 Desired Count 列中获取值...

回答 1 投票 0

在 groovy 中如何将工作区路径作为文件传递给 XmlTestRunListener setReportDir?

项目目标:我正在尝试使用 XmlTestRunListener 和 InstrumentationResultParser 来解析 adb am instrument -r 日志以获取 jenkins 节点上的 xml。我正在使用课程

回答 1 投票 0

XML文件解析放在Unix Path上

我有一个放在 unix 位置的 XML 文件,比如:/home/bojack/SourceFiles/data_file.xml 我想使用 postgres 解析这个 xml 文件。有什么办法吗? 每当 xml 文件是...

回答 0 投票 0

xslt 如何输出突出显示的代码(至少在主要语言中)

我在许多语言(可能是 C、Ada、LaTeX 或其他任何语言)的 标签内有代码和平的文档。 目标是根据语言中的语言解析代码

回答 0 投票 0

用 & 替换 & ,反之亦然

我正在尝试编写代码以将 & 输出到 &,反之亦然。我在下面尝试过,但如果该字段包含“&”,那么它将完全替换它。 示例:如果字段

回答 0 投票 0

当有多个链接标签时获取具有特定rel的链接标签的xsl value-of href属性

我有一个 xml 文件,它有多个名为 tag1 的标签,每个条目标签都有多个链接标签,我需要链接标签的 href,其 rel="x" 1...

回答 0 投票 0

使用 R 加载和清理 Europress 语料库的 xml2 包教程

我正在尝试帮助学生分析 Europress 作为 HTML 页面提供的语料库。要清理语料库,我正在尝试遵循本教程:https://quanti.hypotheses.org/author/croquebert。我

回答 0 投票 0

Azure Databricks:架构不匹配,无法使用 com.databricks.spark.xml 加载增量 xml 数据。 (将结构转换为数组)

我想加载增量 XML 数据,但对于一个字段,spark 有时会在单行时将模式推断为结构,而在有两行时将其推断为数组。 单行示例(此处将 Ship 推断为

回答 1 投票 0

如何从 XML 代码调用 java 函数

需要对现有 XML 代码中使用的硬编码密码进行加密。我有一段 java 代码来加密纯文本密码。 我们如何从现有的 XML 中调用加密的 Java 代码

回答 0 投票 0

UTF-8 的 Java 消化器

how to set encoding type of digester in java.Please help 因为我在使用 digester 解析时在 xml 中设置了编码类型,最终它给出了 字符串类似 bytes(grnlநீ00) 而不是...

回答 2 投票 0

使用XPATH通过子节点获取父节点

我正在尝试使用 e.find('..)' 访问树中元素的父节点,但它不起作用。对于以下代码: 将 xml.etree.ElementTree 导入为 etree xml =“<...

回答 3 投票 0

在 sql 语法中使用 Databricks Spark SQL 中的“FOR XML PATH”

我在 databricks (DBR 10.4 LTS) 上使用 spark 版本 3.2.1,我正在尝试使用 sql 语法中的 spark sql 将 sql server 查询转换为在 spark 集群上运行的 databricks sql 查询。然而,

回答 0 投票 0

如何解析 Logstash 中的 xml 属性并将它们以良好的格式存储在字段中

我正在 Elastic Logstash 中解析 XML 结构。我可以使用 xpath 解析所有元素,但当 xml 属性存储在字段中时,我对格式不满意。 基本的xml结构...

回答 0 投票 0

python解析xml,如何获取值?

我尝试在 Python 中解析 XML 数据并努力提取值。 数据如下所示: [ 我尝试在 Python 中解析 XML 数据并努力提取值。 数据看起来像这样: [<generic:Obs> <generic:ObsDimension value="2020-01-02"/> <generic:ObsValue value="1.1193"/> <generic:Attributes> <generic:Value id="OBS_STATUS" value="A"/> <generic:Value id="OBS_CONF" value="F"/> </generic:Attributes> </generic:Obs>, <generic:Obs> <generic:ObsDimension value="2020-01-03"/> <generic:ObsValue value="1.1147"/> <generic:Attributes> <generic:Value id="OBS_STATUS" value="A"/> <generic:Value id="OBS_CONF" value="F"/> </generic:Attributes> </generic:Obs>] 我想用 ['Date','Value'] 列创建 Pandas DF。 日期应该是<generic:ObsDimension value="2020-01-03"/>外的值,<generic:ObsValue value="1.1147"/>外的值。 当我运行代码时: soup = BeautifulSoup(response.text, 'xml') dates = soup.find_all("ObsDimension") 我得到的结果是: [<generic:ObsDimension value="2020-01-02"/>, <generic:ObsDimension value="2020-01-03"/>, <generic:ObsDimension value="2020-01-06"/>, <generic:ObsDimension value="2020-01-07"/>, <generic:ObsDimension value="2020-01-08"/>, <generic:ObsDimension value="2020-01-09"/>] 但是我怎样才能得到它的日期和相应的值呢? 尝试: import pandas as pd from bs4 import BeautifulSoup xml_doc = '''\ <data> <generic:Obs> <generic:ObsDimension value="2020-01-02"/> <generic:ObsValue value="1.1193"/> <generic:Attributes> <generic:Value id="OBS_STATUS" value="A"/> <generic:Value id="OBS_CONF" value="F"/> </generic:Attributes> </generic:Obs> <generic:Obs> <generic:ObsDimension value="2020-01-03"/> <generic:ObsValue value="1.1147"/> <generic:Attributes> <generic:Value id="OBS_STATUS" value="A"/> <generic:Value id="OBS_CONF" value="F"/> </generic:Attributes> </generic:Obs> </data>''' soup = BeautifulSoup(xml_doc, 'xml') all_data = [] for obs in soup.select('Obs'): date = obs.ObsDimension['value'] value = obs.ObsValue['value'] all_data.append({'Date': date, 'Value': value}) df = pd.DataFrame(all_data) print(df) 印花: Date Value 0 2020-01-02 1.1193 1 2020-01-03 1.1147

回答 1 投票 0

使用 Ruby 将 XML 转换为 JSON 并将其保存为单独的文件

我是 Ruby 程序员新手,刚接到新任务,要转换巨大的 XML 并将其保存到单独的 JSON 文件中。例如: abc12345 BCD 我是 Ruby 程序员新手,刚接到新任务,要转换巨大的 XML 并将其保存到单独的 JSON 文件中。例如: <listing> <id>abc12345</id> <name>BCD</name> <address>12 Main St</address> </listing> <listing> <id>a1b2c3d4</id> <name>XYZ</name> <address>14 Main St</address> </listing> <listing> <id>bcde45678</id> <name>MNO</name> <address>14 Broadway</address> </listing> 我想将它保存到单独的文件中,在此示例中使用 id 作为文件名将是 abc12345.json、a1b2c3d4.json 和 bcde45678.json,每个文件都将包含如下内容: { "listing": { "id": "bcde45678", "name": "MNO", "address": "14 Broadway" } } 有人可以帮我解决这个问题吗?对于所有未来的帮助,我真的很感激 我假设您想将列表块作为 JSON 打印到单个文件。如果您有权访问“active_support/core_ext”和“nokogiri”,并且您不太关心 XML 如何转换为 JSON,您可以这样做: require 'active_support/core_ext' require 'nokogiri' xml = Nokogiri::XML(File.read "yourfile") xml.search("//listing").each do |l| filename = l.at_xpath("id").content File.open(filename + '.json', 'w') do |file| file.print Hash.from_xml(l.to_xml).to_json end end 这是使用 XMLSimple(或者不是,这是你的毒药选择)和使用 JSON 的核心模块扩展的好案例: require 'json/add/core' require 'xmlsimple' xml_files = [ '<listing> <id>abc12345</id> <name>BCD</name> <address>12 Main St</address> </listing>', '<listing> <id>a1b2c3d4</id> <name>XYZ</name> <address>14 Main St</address> </listing>', '<listing> <id>bcde45678</id> <name>MNO</name> <address>14 Broadway</address> </listing>' ] xml_files.each do |xml| obj = XmlSimple.xml_in(xml, :ForceArray => false) File.write(obj['id'] + '.json', JSON.pretty_generate(obj)) end 创建三个文件: a1b2c3d4.json: { "id": "a1b2c3d4", "name": "XYZ", "address": "14 Main St" } abc12345.json: { "id": "abc12345", "name": "BCD", "address": "12 Main St" } bcde45678.json: { "id": "bcde45678", "name": "MNO", "address": "14 Broadway" } 我怀疑 XMLSimple 是基于 Perl 的 XMLSimple,它读取 XML 文件并将其转换为本机对象。在这种情况下,它将创建 XML 的散列,允许轻松访问 <id> 标签的内容作为普通散列键。 XMLSimple 在将传入的 XML 解析为对象时具有并且需要很大的灵活性,因此我使用 :ForceArray => false 标志对其进行了微调,这在为散列键创建值时为代码提供了一些宽容度。您需要花一些时间浏览文档以了解它的选项。 JSON.pretty_generate(obj) 创建格式良好的输出。这会增加文件大小,但如果有人必须阅读这些文件,那也没关系。如果不是,请使用 obj.to_json 生成更紧凑的输出,这将减少读取 JSON 文件时的 I/O 时间。 负责编写 XML 的各个块。 你不说“巨大”是什么意思。在我的世界中,巨大的文件可以达到数 GB,甚至达到两位数。对于非常大的 XML 文件,我建议研究使用 Nokogiri::SAX 来使用流处理并生成小的 XML 文件,类似于您的示例 XML。然后你可以使用上面的代码迭代那些。 如果文件不是真的很大,而只是很大,让 Nokogiri 将整个文件解析为 DOM 并遍历<listing> 节点,并将它们输出到文件。您提供的示例 XML 对于真实的 XML 文件无效,因为它缺少包含节点,因此,基于“固定”版本: require 'json/add/core' require 'nokogiri' require 'xmlsimple' xml_files =<<EOT <xml_root> <listing> <id>abc12345</id> <name>BCD</name> <address>12 Main St</address> </listing> <listing> <id>a1b2c3d4</id> <name>XYZ</name> <address>14 Main St</address> </listing> <listing> <id>bcde45678</id> <name>MNO</name> <address>14 Broadway</address> </listing> </xml_root> EOT doc = Nokogiri::XML(xml_files) xml_files = [] doc.search('listing').each do |listing| xml_file = listing.at('id').text + '.xml' xml_files << xml_file File.write(xml_file, listing.to_xml) end xml_files.each do |file| obj = XmlSimple.xml_in(File.read(file), :ForceArray => false) File.write(obj['id'] + '.json', JSON.pretty_generate(obj)) end 运行后,这些文件存在,JSON文件的内容对应对应的XML文件: a1b2c3d4.json a1b2c3d4.xml abc12345.json abc12345.xml bcde45678.json bcde45678.xml 对于简单的 XML,您可以免除 XMLSimple,但对于大型 XML 块,以下内容可能会有点痛苦,但是,至少您可以选择这种痛苦。这是没有 SimpleXML 的方法: require 'json/add/core' require 'nokogiri' xml_files =<<EOT <xml_root> <listing> <id>abc12345</id> <name>BCD</name> <address>12 Main St</address> </listing> <listing> <id>a1b2c3d4</id> <name>XYZ</name> <address>14 Main St</address> </listing> <listing> <id>bcde45678</id> <name>MNO</name> <address>14 Broadway</address> </listing> </xml_root> EOT doc = Nokogiri::XML(xml_files) xml_files = [] doc.search('listing').each do |listing| id, name, address = %w[id name address].map { |node| listing.at(node).content } File.write( id + '.json', { 'id' => id, 'name' => name, 'address' => address }.to_json ) end 尝试将 XML 转换为 JSON 并保存其他 JSON 文件 require "rubygems" require "crack" require "json" folder_path = '/xml_files/local/folder_path' Dir.foreach(folder_path) do |xml_file| next if xml_file == '.' || xml_file == '..' myXML = Crack::XML.parse(File.read("/local/folder_path/#{xml_file}")) myJSON = JSON.pretty_generate(myXML) filename_without = xml_file.sub(".xml", "") File.open("created_json_files_local_path/#{filename_without}.json", 'w') do |f| f.write(myJSON) end end

回答 3 投票 0

exception':“无法解析 QName 'SOAP:',第 1 行,第 7 列

我从 api 得到了这个 xml,但之后我想使用 xpath 获取 xml 属性的值,但在第一步 树 = etree.parse(StringIO(hotel_details_logs)) 我有异常...

回答 0 投票 0

为 python tkinter 解析 nmap xml 输出

我是一名学生,我有点迷路,我有一个学校项目。该项目使用 Linux 命令行, 我正在使用 nmap 和 python 这是我项目的第一部分: 这个想法是创造...

回答 1 投票 0

INFORMATICA POWERCENTER:映射问题和 XML 输出

我是Powercenter的新手,想把一个关系输出结果转换成一个xml文件。 我有一个带有 xml 结构的 xsd 文件。 当我将其导入 Designer 时,PWC 会自动创建

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.