xml-parsing 相关问题

XML解析器遍历包含XML树的文本文档,并允许使用层次结构中的信息。将此标记用于实现XML解析器的问题,或者通过使用给定语言的现有解析器生成的问题。

如何在Python中高效解析和处理大型XML文件?

我有一个Python程序需要解析和处理大型XML文件,但在处理几GB大小的文件时遇到性能问题。 我目前正在使用

回答 2 投票 0

解析 dotnet 中包含两个命名空间的 XML

我有一个从 wcf 返回的 xml,我必须将其反序列化为对象。不幸的是我无法使用 wcf 数据契约,因为我的公司正在淘汰 WCF,所以这个解决方案...

回答 1 投票 0

如何在SQL Server中获取xml列的值

如何获取列的XML值? SELECT PaymentMethodDetail.value('(/ paymentMethodDetail/EFTPaymentDetails/AccountType/text())[0]','varchar(30)') as AccounType,* FROM paymentTable <

回答 1 投票 0

使用 CROSS APPLY 进行 SQL Server XML 解析

我一直在研究这个 XML,它嵌套在 SQL Server 中表的一列中。 我有一个代码直到几天前才对我有用,但我目前遇到的问题是我无法解决

回答 1 投票 0

将 XML 转换/解析为 CSV 文件

这里有人可以指导我如何使用 python 3.9 将此 xml 转换为 csv 吗?目前我很难解析这个 xml。 下面是我的xml结构: 这里有人可以指导我如何使用 python 3.9 将此 xml 转换为 csv 吗?目前我很难解析这个 xml。 下面是我的xml结构: <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE raml SYSTEM 'raml20.dtd'> <raml version="2.0" xmlns="raml20.xsd"> <cmData type="actual"> <header> <log dateTime="2023-09-11T09:32:44.000+08:00" action="created" appInfo="ActualExporter">UIValues are used</log> </header> <managedObject class="LNCEL" version="FLF22R3_2207_10_2207_10" distName="PLMN-PLMN/MRBTS-10000/LNBTS-100007/LNCEL-10" id="10000"> <p name="mcc">100</p> <p name="mnc">20</p> <p name="name">Cell01</p> <p name="a1TimeToTriggerDeactInterMeas">320ms</p> <p name="a2RedirectQci1">disabled</p> </managedObject> </cmData> </raml> 我想要这样的输出: 先谢谢大家,期待您的意见。 这是一个如何使用 beautifulsoup 解析 XML 的示例: import pandas as pd from bs4 import BeautifulSoup with open("your_file.xml", "r") as f_in: soup = BeautifulSoup(f_in.read(), "xml") header = soup.header dt = header.log["dateTime"] all_data = [] for mo in soup.select("managedObject"): version = mo["version"] dist_name = mo["distName"] moid = mo["id"] all_data.append( { "DATETIME": dt, "VERSION": version, "DISTNAME": dist_name, "MOID": moid, **{p["name"]: p.text for p in mo.select("p") for a in p.attrs}, } ) df = pd.DataFrame(all_data) print(df) 打印: DATETIME VERSION DISTNAME MOID mcc mnc name a1TimeToTriggerDeactInterMeas a2RedirectQci1 0 2023-09-11T09:32:44.000+08:00 FLF22R3_2207_10_2207_10 PLMN-PLMN/MRBTS-10000/LNBTS-100007/LNCEL-10 10000 100 20 Cell01 320ms disabled

回答 1 投票 0

Oracle XML 许多节点

表 TEST_XML 中有以下 XML,其中一列“XMLTEXT”的类型为 CLOB。 我希望最后收到以下类似表格的结果: 用户身份...

回答 1 投票 0

cvc-complex-type.2.4.c:匹配通配符严格,但找不到元素“mvc:annotation-driven”的声明

我猜这是一个xml解析问题,但我就是看不到它在哪里。我读了一些关于这个主题的文章,但没有任何帮助: 我有这个 spring mvc 配置: 我猜这是一个 xml 解析问题,但我只是看不出它在哪里。我读了一些关于这个主题的文章,但没有任何帮助: 我有这个 spring mvc 配置: <?xml version='1.0' encoding='UTF-8' ?> <!-- was: <?xml version="1.0" encoding="UTF-8"?> --> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:p="http://www.springframework.org/schema/p" xmlns:aop="http://www.springframework.org/schema/aop" xmlns:tx="http://www.springframework.org/schema/tx" xmlns:mvc="http://www.springframework.org/schema/mvc" xmlns:context="http://www.springframework.org/schema/context" xsi:schemaLocation="http://www.springframework.org/schema/beans http://www.springframework.org/schema/beans/spring-beans-4.0.xsd http://www.springframework.org/schema/aop http://www.springframework.org/schema/aop/spring-aop-4.0.xsd http://www.springframework.org/schema/tx http://www.springframework.org/schema/tx/spring-tx-4.0.xsd http://www.springframework.org/schema/security http://www.springframework.org/schema/mvc http://www.springframework.org/schema/mvc/spring-mvc-4.0.xsd http://www.springframework.org/schema/context http://www.springframework.org/schema/context/spring-context-4.0.xsd" > <mvc:annotation-driven /> <context:component-scan base-package="controllers" /> <bean id="viewResolver" class="org.springframework.web.servlet.view.InternalResourceViewResolver" p:prefix="/WEB-INF/jsp/" p:suffix=".jsp" /> </beans> 这是 tomcat 所说的: org.xml.sax.SAXParseException; lineNumber: 23; columnNumber: 30; cvc-complex-type.2.4.c: The matching wildcard is strict, but no declaration can be found for element 'mvc:annotation-driven'. com.sun.org.apache.xerces.internal.util.ErrorHandlerWrapper.createSAXParseException(ErrorHandlerWrapper.java:203) com.sun.org.apache.xerces.internal.util.ErrorHandlerWrapper.error(ErrorHandlerWrapper.java:134) com.sun.org.apache.xerces.internal.impl.XMLErrorReporter.reportError(XMLErrorReporter.java:437) com.sun.org.apache.xerces.internal.impl.XMLErrorReporter.reportError(XMLErrorReporter.java:368) com.sun.org.apache.xerces.internal.impl.XMLErrorReporter.reportError(XMLErrorReporter.java:325) com.sun.org.apache.xerces.internal.impl.xs.XMLSchemaValidator$XSIErrorReporter.reportError(XMLSchemaValidator.java:458) com.sun.org.apache.xerces.internal.impl.xs.XMLSchemaValidator.reportSchemaError(XMLSchemaValidator.java:3237) com.sun.org.apache.xerces.internal.impl.xs.XMLSchemaValidator.handleStartElement(XMLSchemaValidator.java:1917) com.sun.org.apache.xerces.internal.impl.xs.XMLSchemaValidator.emptyElement(XMLSchemaValidator.java:766) com.sun.org.apache.xerces.internal.impl.XMLNSDocumentScannerImpl.scanStartElement(XMLNSDocumentScannerImpl.java:356) com.sun.org.apache.xerces.internal.impl.XMLDocumentFragmentScannerImpl$FragmentContentDriver.next(XMLDocumentFragmentScannerImpl.java:2786) com.sun.org.apache.xerces.internal.impl.XMLDocumentScannerImpl.next(XMLDocumentScannerImpl.java:606) com.sun.org.apache.xerces.internal.impl.XMLNSDocumentScannerImpl.next(XMLNSDocumentScannerImpl.java:117) com.sun.org.apache.xerces.internal.impl.XMLDocumentFragmentScannerImpl.scanDocument(XMLDocumentFragmentScannerImpl.java:510) com.sun.org.apache.xerces.internal.parsers.XML11Configuration.parse(XML11Configuration.java:848) com.sun.org.apache.xerces.internal.parsers.XML11Configuration.parse(XML11Configuration.java:777) com.sun.org.apache.xerces.internal.parsers.XMLParser.parse(XMLParser.java:141) com.sun.org.apache.xerces.internal.parsers.DOMParser.parse(DOMParser.java:243) com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderImpl.parse(DocumentBuilderImpl.java:348) org.springframework.beans.factory.xml.DefaultDocumentLoader.loadDocument(DefaultDocumentLoader.java:76) org.springframework.beans.factory.xml.XmlBeanDefinitionReader.doLoadDocument(XmlBeanDefinitionReader.java:428) org.springframework.beans.factory.xml.XmlBeanDefinitionReader.doLoadBeanDefinitions(XmlBeanDefinitionReader.java:390) org.springframework.beans.factory.xml.XmlBeanDefinitionReader.loadBeanDefinitions(XmlBeanDefinitionReader.java:335) org.springframework.beans.factory.xml.XmlBeanDefinitionReader.loadBeanDefinitions(XmlBeanDefinitionReader.java:303) org.springframework.beans.factory.support.AbstractBeanDefinitionReader.loadBeanDefinitions(AbstractBeanDefinitionReader.java:180) org.springframework.beans.factory.support.AbstractBeanDefinitionReader.loadBeanDefinitions(AbstractBeanDefinitionReader.java:216) org.springframework.beans.factory.support.AbstractBeanDefinitionReader.loadBeanDefinitions(AbstractBeanDefinitionReader.java:187) org.springframework.web.context.support.XmlWebApplicationContext.loadBeanDefinitions(XmlWebApplicationContext.java:125) org.springframework.web.context.support.XmlWebApplicationContext.loadBeanDefinitions(XmlWebApplicationContext.java:94) org.springframework.context.support.AbstractRefreshableApplicationContext.refreshBeanFactory(AbstractRefreshableApplicationContext.java:129) org.springframework.context.support.AbstractApplicationContext.obtainFreshBeanFactory(AbstractApplicationContext.java:540) org.springframework.context.support.AbstractApplicationContext.refresh(AbstractApplicationContext.java:454) org.springframework.web.servlet.FrameworkServlet.configureAndRefreshWebApplicationContext(FrameworkServlet.java:658) org.springframework.web.servlet.FrameworkServlet.createWebApplicationContext(FrameworkServlet.java:624) org.springframework.web.servlet.FrameworkServlet.createWebApplicationContext(FrameworkServlet.java:672) org.springframework.web.servlet.FrameworkServlet.initWebApplicationContext(FrameworkServlet.java:543) org.springframework.web.servlet.FrameworkServlet.initServletBean(FrameworkServlet.java:484) org.springframework.web.servlet.HttpServletBean.init(HttpServletBean.java:136) javax.servlet.GenericServlet.init(GenericServlet.java:158) org.apache.catalina.authenticator.AuthenticatorBase.invoke(AuthenticatorBase.java:503) org.apache.catalina.valves.ErrorReportValve.invoke(ErrorReportValve.java:79) org.apache.catalina.valves.AbstractAccessLogValve.invoke(AbstractAccessLogValve.java:610) org.apache.catalina.connector.CoyoteAdapter.service(CoyoteAdapter.java:526) org.apache.coyote.http11.AbstractHttp11Processor.process(AbstractHttp11Processor.java:1078) org.apache.coyote.AbstractProtocol$AbstractConnectionHandler.process(AbstractProtocol.java:655) org.apache.coyote.http11.Http11NioProtocol$Http11ConnectionHandler.process(Http11NioProtocol.java:222) org.apache.tomcat.util.net.NioEndpoint$SocketProcessor.doRun(NioEndpoint.java:1566) org.apache.tomcat.util.net.NioEndpoint$SocketProcessor.run(NioEndpoint.java:1523) java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142) java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) org.apache.tomcat.util.threads.TaskThread$WrappingRunnable.run(TaskThread.java:61) java.lang.Thread.run(Thread.java:745) 知道我的代码可能有什么问题吗? 谢谢 如果您查看架构位置,您会注意到包含 http://www.springframework.org/schema/security 的行。 此行破坏了预期的格式,格式应为 [namespace] [xsd-location]。这行基本上搞乱了正确的格式。要解决此问题,请添加 xsd 位置或删除该行。为了防止这种情况,我通常也在 xsi:schemaLocation 属性的布局中遵循格式(如果您相应地格式化,很明显该部分丢失了).. xsi:schemaLocation=" http://www.springframework.org/schema/beans http://www.springframework.org/schema/beans/spring-beans-4.0.xsd http://www.springframework.org/schema/aop http://www.springframework.org/schema/aop/spring-aop-4.0.xsd http://www.springframework.org/schema/tx http://www.springframework.org/schema/tx/spring-tx-4.0.xsd http://www.springframework.org/schema/security http://www.springframework.org/schema/mvc http://www.springframework.org/schema/mvc/spring-mvc-4.0.xsd http://www.springframework.org/schema/context http://www.springframework.org/schema/context/spring-context-4.0.xsd"> 作为附加提示,建议使用无版本 xsd 文件,因此不要使用 spring-beans-4.0.xsd,而是使用 spring-beans.xsd。 xsi:schemaLocation=" http://www.springframework.org/schema/beans http://www.springframework.org/schema/beans/spring-beans.xsd http://www.springframework.org/schema/aop http://www.springframework.org/schema/aop/spring-aop.xsd http://www.springframework.org/schema/tx http://www.springframework.org/schema/tx/spring-tx.xsd http://www.springframework.org/schema/security http://www.springframework.org/schema/security/spring-security.xsd http://www.springframework.org/schema/mvc http://www.springframework.org/schema/mvc/spring-mvc.xsd http://www.springframework.org/schema/context http://www.springframework.org/schema/context/spring-context.xsd"> 此类错误的一般答案是您需要正确检查指定的命名空间,特别是在“xsi:schemaLocation”中。 检查 xsi:schemaLocation 中是否缺少一些命名空间。这可能是解决此类错误的方法

回答 3 投票 0

添加/替换 XML 标签的 Python 脚本

我有这个 Python 脚本,它应该在 XML 文档中查找现有标签,并将其替换为新的、更具描述性的标签。问题是,在我运行脚本后,它似乎只能...

回答 1 投票 0

使用 Woodstox 解析器解析“&”字符时出错

Java:1.6 伍德斯托克斯:4.1.4 我目前正在尝试让 Woodstox xml 解析器成为我的朋友。但开始真的很难:) 我有一个小的?解析xml时出现这样的问题: Java:1.6 伍德斯托克斯:4.1.4 我目前正在尝试让 Woodstox xml 解析器成为我的朋友。但开始真的很难:) 我有一个小的?像这样解析 xml 时出现问题: <teams> <team id="team1">Mom & Dad</team> <team id="team2">Son & Daughter</team> </teams> 很简单,但不幸的是我遇到了这个异常: Exception in thread "main" [com.ctc.wstx.exc.WstxLazyException] com.ctc.wstx.exc.WstxUnexpectedCharException: Unexpected character ' ' (code 32) (missing name?) at [row,col {unknown-source}]: [2,24] 发生这种情况是因为性格 &。 是否可以成功读取xml而不出现此异常? & 是无效字符,应该转义为 &amp; 或包含在 CDATA 部分中。 <teams> <team id="team1">Mom &amp; Dad</team> <team id="team2"><![CDATA[Son & Daughter]]></team> </teams> 来自:http://www.w3.org/TR/REC-xml/#syntax 与号 (&) 和左尖括号 (<) MUST NOT appear in their literal form, except when used as markup delimiters, or within a comment, a processing instruction, or a CDATA section. If they are needed elsewhere, they MUST be escaped using either numeric character references or the strings " &amp; " 和 " &lt; " 分别。

回答 1 投票 0

根据静态块中给定的 xsd 与非静态块验证 xml

我有两种方法根据存储在旧应用程序资源中的 xsd 验证 xml。每天验证 1000 多次,代码 7*24 小时运行。 方法一: 就是创建静态

回答 1 投票 0

将孙子 XML 解析为 pandas 数据框

我看过各种问题和答案,但没有一个完全满足我的需求。 我有 xml 平面文件(由硬件 SCADA 系统生成),格式为(编辑:草率复制并粘贴先前的...

回答 1 投票 0

解析数据透视的 xml

我有以下xml数据 &l...

回答 1 投票 0

如何在 XML 处理 Python 中的单个变量中获取多个相同的标签文本?

国土安全 劳工 <PREAMB> <AGENCY TYPE="S">HOMELAND SECURITY </AGENCY> <AGENCY TYPE="O">LABOR</AGENCY> <AGY> <HD SOURCE="HED">AGENCY:</HD> <P>U.S. Citizenship and Immigration Services</P> </AGY> </PREAMB> 我怎样才能得到这个 - “部门是”:“国土安全部、劳工部:美国公民及移民服务部” 下面的代码只是返回 - “部门是”:“劳工:美国公民及移民服务局” for agency in preambl.findall("./PREAMB/AGENCY"): departments = agency.text if departments != '' or departments != None: if pre.findall("./PREAMB/AGY"): agency1 = '' for agencies in pre.findall("./PREAMB/AGY/P"): for para1 in agencies.itertext(): agency1 += para1.replace('\n', ' ') agency1 = ' '.join(agency1.split()) if agency1: agency1 = '{"departments are":"' + str(departments) + ' : ' + str(agency1) + '"}' agency1 = json.loads(agency1) 如有任何帮助,我们将不胜感激。 我认为你把事情搞得太复杂了。试试这个方法: targets = ['.//AGENCY','.//AGY//P'] agencies = [] for target in targets: agencies.extend([agency.text for agency in preambl.findall(f'{target}')]) print('agencies are: ',agencies) 看看是否得到了预期的输出。

回答 1 投票 0

Azure 服务总线 JMS Spring 长时间运行作业

我知道这个问题被问了很多次,但我找不到任何好的答案。 所以我有一个 AzureServiceBus,每当新的 xml 文件上传到时,它都会从 AzureBlob 获取新消息...

回答 1 投票 0

如何将xml转换为DataTable?

我有一个内容类似于xml的文件,我想解析它并将数据绑定到Datatable。我该怎么做 ?我的文件 xml 看起来像这样 我有一个内容类似于xml的文件,我想解析它并将数据绑定到Datatable。我该怎么做 ?我的文件 xml 看起来像这样 <StudentListSubject> <Member personId="1" active="yes"> <Name id="Mary"/> <SubjectList> <Subjectvalue>Maths</Subjectvalue> <Subjectvalue>Literature</Subjectvalue> </SubjectList> </Member> <Member personId="2" active="yes"> <Name id="John"/> <SubjectList> <Subjectvalue>Physics</Subjectvalue> <Subjectvalue>Maths</Subjectvalue> <Subjectvalue>Literature</Subjectvalue> </SubjectList> </Member> </StudentListSubject> DataTable 将有 3 列如下 PersonID#ID#Subject 1#Mary#Maths,Literature 2#John#Physics,Maths,Literature 我已经使用XmlReader来获取数据,但我不知道如何获取id和主题列表,只获取人员id。 var dt = new DataTable(); dt.Columns.Add("PersonID", typeof(string)); dt.Columns.Add("ID", typeof(string)); dt.Columns.Add("Subject", typeof(string)); var reader = XmlReader.Create("C:\\test.xml"); reader.ReadToFollowing("Member"); do { reader.MoveToFirstAttribute(); var personId = reader.Value; //get id //get list subject dt.Rows.Add(new object[] { personId , "id" , "subject" }); } while (reader.ReadToFollowing("Member")); 这是您可以使用的常用功能,您可以根据您的方式自定义 using System; using System.Data; using System.Xml; public class XmlToDataTableConverter { public static DataTable ConvertXmlToDataTable(string xmlFilePath) { DataTable dataTable = new DataTable(); try { using (XmlTextReader xmlReader = new XmlTextReader(xmlFilePath)) { DataSet dataSet = new DataSet(); dataSet.ReadXml(xmlReader); if (dataSet.Tables.Count > 0) { dataTable = dataSet.Tables[0]; } } } catch (Exception ex) { Console.WriteLine("Error: " + ex.Message); } return dataTable; } string xmlFilePath = "data.xml"; private Void ConvertToDataTable() { DataTable dataTable = XmlToDataTableConverter.ConvertXmlToDataTable(xmlFilePath); } }

回答 1 投票 0

如何将通用 xml 读入通用层次类

基本上我想编写一个通用的 XML 查看器......给出类似的内容: <...

回答 1 投票 0

使用python中的xml树库从xml中删除元素

我正在开发一个项目,其中我对某些叶子的图像进行了注释,并将它们保存为 xml 格式,以便使用对象检测来识别叶子上的害虫。 但由于我面临着一些歧义......

回答 2 投票 0

从包中导入手动声明的嵌套架构会导致 NullPointerSchema

我正在尝试使用 Databricks 的 Spark-xml 和以下代码行将 XML 文件解析为 DataFrame: val xmlDF = 火花 。读 .option("rowTag", "MeterReadingDocument") ....

回答 1 投票 0

如何在 Erlang 中解析 XML?

我在元组列表中有这个带有 XML 提取的字符串: MessageResponse = [{"代码",0},{"描述","描述"},{"respuestaServicioSoap",{{"

回答 2 投票 0

访问机器文件中的 xml 数据

我想阅读一些机器数据的分析日志。我想要读取的数据以 xml 形式写入,但位于文件末尾。 我遇到的问题是文件以不可读的机器数据开头......

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.