extract 相关问题

与从(通常是最低结构化的)数据源检索特定信息有关的问题,例如网站,媒体文件,源代码集合或压缩存档(在这种情况下,所需信息是一个或多个原始的未压缩文件)。使用此标记时,请添加其他标记以阐明您的问题所涉及的特定环境/语言/方案。

要提取的 XML 值

我需要提取和之间的值,并且始终属于它之前的值。例如 Fabrikat:本田,类型:Roadrunner 等。 我需要提取 <bl> 和 </bl> 之间的值,并且始终属于它之前的值。例如 Fabrikat:本田,类型:Roadrunner 等等。 <?xml version="1.0" encoding="UTF-8" standalone="yes"?> <onlv xmlns="http://www.oenorm.at/schema/A2063/2021-03-01"> <metadaten></metadaten> <grafiktabelle></grafiktabelle> <leistungsteiltabelle></leistungsteiltabelle> <zztabelle></zztabelle> <akztabelle></akztabelle> <zugelassenenachlaesse></zugelassenenachlaesse> <ausschreibungs-lv> <gliederung-og> <og-liste> <og nr="01"> <og-eigenschaften></og-eigenschaften> <lb></lb> <svb></svb> <lg-liste> <lg nr="01"> <lg-eigenschaften></lg-eigenschaften> <ulg-liste> <ulg nr="01"> <ulg-eigenschaften></ulg-eigenschaften> <positionen> <grundtextnr nr="01"> <ungeteilteposition mfv=""> <pos-eigenschaften> <stichwort>Fleischwolf</stichwort> <langtext><p>Fabrikat: <bl>Honda</bl></p><p>Type: <bl>Roadrunner</bl></p><p>Preis: <bl>12580.00</bl> EUR</p> </langtext> <einheit>Stk</einheit> <pzzv> <normalposition></normalposition> </pzzv> <leistungsteil>1</leistungsteil> <lvmenge>1</lvmenge> <nichtangeboten></nichtangeboten> </pos-eigenschaften> </ungeteilteposition> </grundtextnr> <grundtextnr nr="02"> <ungeteilteposition mfv=""> <pos-eigenschaften> <stichwort>Induktionsherd</stichwort> <langtext><p>Fabrikat: <bl>BMW</bl></p><p>Type: <bl>GS1250</bl></p><p>Preis: <bl>22870.00</bl> EUR</p> </langtext> <einheit>Stk</einheit> <pzzv> <normalposition></normalposition> </pzzv> <leistungsteil>1</leistungsteil> <lvmenge>1</lvmenge> <nichtangeboten></nichtangeboten> </pos-eigenschaften> </ungeteilteposition> </grundtextnr> <grundtextnr nr="03"> <ungeteilteposition mfv=""> <pos-eigenschaften> <stichwort>Kühlwanne</stichwort> <langtext><p>Fabrikat: <bl>Harley Davidson</bl></p><p>Type: <bl>Bigfoot</bl></p><p>Preis: <bl>28756.00</bl> EUR</p> </langtext> <einheit>Stk</einheit> <pzzv> <normalposition></normalposition> </pzzv> <wesentlicheposition>W</wesentlicheposition> <leistungsteil>1</leistungsteil> <lvmenge>1</lvmenge> <nichtangeboten></nichtangeboten> </pos-eigenschaften> </ungeteilteposition> </grundtextnr> <grundtextnr nr="04"> <ungeteilteposition mfv=""> <pos-eigenschaften> <stichwort>Kaffeemaschine (Vollautomat)</stichwort> <langtext><p>Fabrikat: <bl>Franke</bl></p><p>Type: <bl>GrossUndGut</bl></p><p>Preis: <bl>18000.00</bl> EUR</p> </langtext> <einheit>Stk</einheit> <pzzv> <eventualposition></eventualposition> </pzzv> <leistungsteil>1</leistungsteil> <lvmenge>1</lvmenge> <nichtangeboten></nichtangeboten> </pos-eigenschaften> </ungeteilteposition> </grundtextnr> </positionen> </ulg> <ulg nr="02"> <ulg-eigenschaften></ulg-eigenschaften> <positionen> <grundtextnr nr="01"> <ungeteilteposition mfv=""> <pos-eigenschaften> <stichwort>Maschine 4</stichwort> <langtext><p>Fabrikat: <bl>DELL</bl></p><p>Type: <bl>XPS</bl></p><p>Preis: <bl>1280.00</bl> EUR</p> </langtext> <einheit>Stk</einheit> <pzzv> <normalposition></normalposition> </pzzv> <leistungsteil>1</leistungsteil> <lvmenge>1</lvmenge> <nichtangeboten></nichtangeboten> </pos-eigenschaften> </ungeteilteposition> </grundtextnr> <grundtextnr nr="02"> <ungeteilteposition mfv=""> <pos-eigenschaften> <stichwort>Maschine 5</stichwort> <langtext><p>Fabrikat: <bl>HP</bl></p><p>Type: <bl>12345</bl></p><p>Preis: <bl>1890.00</bl> EUR</p> </langtext> <einheit>Stk</einheit> <pzzv> <normalposition></normalposition> </pzzv> <leistungsteil>1</leistungsteil> <lvmenge>1</lvmenge> <nichtangeboten></nichtangeboten> </pos-eigenschaften> </ungeteilteposition> </grundtextnr> </positionen> </ulg> </ulg-liste> </lg> <lg nr="02"> <lg-eigenschaften></lg-eigenschaften> <ulg-liste> <ulg nr="01"> <ulg-eigenschaften></ulg-eigenschaften> <positionen> <grundtextnr nr="01"> <ungeteilteposition mfv=""> <pos-eigenschaften> <stichwort>Maschine 6</stichwort> <langtext><p>Fabrikat: <bl>Sony</bl></p><p>Type: <bl>Workstation</bl></p><p>Preis: <bl>2500.00</bl> EUR</p> </langtext> <einheit>Stk</einheit> <pzzv> <normalposition></normalposition> </pzzv> <leistungsteil>1</leistungsteil> <lvmenge>1</lvmenge> <nichtangeboten></nichtangeboten> </pos-eigenschaften> </ungeteilteposition> </grundtextnr> </positionen> </ulg> <ulg nr="02"> <ulg-eigenschaften></ulg-eigenschaften> <positionen> <grundtextnr nr="01"> <ungeteilteposition mfv=""> <pos-eigenschaften> <stichwort>Maschine 7</stichwort> <langtext><p>Fabrikat: <bl>ACER</bl></p><p>Type: <bl>123</bl></p><p>Preis: <bl>1280.00</bl> EUR</p> </langtext> <einheit>Stk</einheit> <pzzv> <normalposition> </normalposition> </pzzv> <leistungsteil>1</leistungsteil> <lvmenge>1</lvmenge> <nichtangeboten></nichtangeboten> </pos-eigenschaften> </ungeteilteposition> </grundtextnr> </positionen> </ulg> </ulg-liste> </lg> </lg-liste> </og> </og-liste> </gliederung-og> </ausschreibungs-lv> </onlv> 在前一篇文章中,我得到了当时有效的草案解决方案。但草案发生了变化。所以我尝试改变它: <xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:oen="http://www.oenorm.at/schema/A2063/2021-03-01" exclude-result-prefixes="oen"> <xsl:output method="xml" indent="yes"/> <xsl:template match="/"> <dataroot> <xsl:variable select=".//oen:og-liste"> <xsl:for-each select=".//oen:og"> <xsl:variable select="following-sibling::oen:lg-liste[1]"> <xsl:variable select=".//oen:lg"> <xsl:variable select=".//oen:ulg-liste[1]"> <xsl:for-each select=".//oen:ulg"> <xsl:for-each select=".//oen:grundtextnr"> <xsl:for-each select=".//oen:langtext/oen:p"> <onlv> <p> <xsl:value-of select="substring-before(., ':')"/> </p> <bl> <xsl:value-of select="oen:bl"/> </bl> </onlv> </xsl:for-each> </xsl:for-each> </xsl:for-each> </xsl:variable> </xsl:variable> </xsl:variable> </xsl:for-each> </xsl:variable> </dataroot> </xsl:template> </xsl:stylesheet> 有很多代码来解释完整的层次结构。我需要的东西显示在这里: <?xml version="1.0" encoding="UTF-8"?> <dataroot xmlns:od="urn:schemas-microsoft-com:officedata" generated="2023-10-27T10:02:32"> <bl> <og>01</og> <lg>01</lg> <ulg>01</ulg> <grundtextnr>01</grundtextnr> <fabrikat>Honda</fabrikat> <type>Roadrunner</type> <preis>12580,00</preis> </bl> <bl> <og>01</og> <lg>01</lg> <ulg>01</ulg> <grundtextnr>02</grundtextnr> <fabrikat>BMW</fabrikat> <type>GS1250</type> <preis>22870,00</preis> </bl> <bl> <og>01</og> <lg>01</lg> <ulg>01</ulg> <grundtextnr>03</grundtextnr> <fabrikat>Harley Davidson</fabrikat> <type>Bigfoot</type> <preis>28756,00</preis> </bl> <bl> <og>01</og> <lg>01</lg> <ulg>01</ulg> <grundtextnr>04</grundtextnr> <fabrikat>Franke</fabrikat> <type>GrossUndGut</type> <preis>18000,00</preis> </bl> <bl> <og>01</og> <lg>01</lg> <ulg>02</ulg> <grundtextnr>01</grundtextnr> <fabrikat>Dell</fabrikat> <type>XPS</type> <preis>1280,00</preis> </bl> <bl> <og>01</og> <lg>01</lg> <ulg>02</ulg> <grundtextnr>02</grundtextnr> <fabrikat>HP</fabrikat> <type>12345</type> <preis>1890,00</preis> </bl> <bl> <og>01</og> <lg>02</lg> <ulg>01</ulg> <grundtextnr>01</grundtextnr> <fabrikat>Sony</fabrikat> <type>Workstation</type> <preis>2500,00</preis> </bl> <bl> <og>01</og> <lg>02</lg> <ulg>02</ulg> <grundtextnr>01</grundtextnr> <fabrikat>Acer</fabrikat> <type>123</type> <preis>1280,00</preis> </bl> </dataroot> 我再次主要是猜测这里,但在我看来你想做这样的事情(使用 XSLT 1.0): <xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:oen="http://www.oenorm.at/schema/A2063/2021-03-01" exclude-result-prefixes="oen"> <xsl:output method="xml" indent="yes"/> <xsl:template match="/"> <dataroot> <xsl:for-each select="//oen:og"> <xsl:variable name="og" select="@nr"/> <xsl:for-each select=".//oen:lg"> <xsl:variable name="lg" select="@nr"/> <xsl:for-each select=".//oen:ulg"> <xsl:variable name="ulg" select="@nr"/> <xsl:for-each select=".//oen:grundtextnr"> <bl> <og> <xsl:value-of select="$og"/> </og> <lg> <xsl:value-of select="$lg"/> </lg> <ulg> <xsl:value-of select="$ulg"/> </ulg> <grundtextnr> <xsl:value-of select="@nr"/> </grundtextnr> <xsl:for-each select=".//oen:langtext/oen:p"> <xsl:element name="{substring-before(., ':')}"> <xsl:value-of select="oen:bl"/> </xsl:element> </xsl:for-each> </bl> </xsl:for-each> </xsl:for-each> </xsl:for-each> </xsl:for-each> </dataroot> </xsl:template> </xsl:stylesheet>

回答 1 投票 0

从雪花中的列中获取非数值

我的列的值如下, 列名 4000-1234 3000-7788 0000-0000 ABCxyz1-in mno12c-in 12qwe 输入 AL-分配 565jac-输入 数据上来 数据 up-21 Drop-dwn 我只需要提取非

回答 1 投票 0

从 Windows 上的存档中提取并清理单个文件

以下 bash 代码从存档中解压缩单个文件,删除前 3 个字节,从文件的每一行中删除最后一个制表符分隔值 ( 1),然后保存它。我该如何重写...

回答 1 投票 0

如何在Python中从字符串中提取单词? [重复]

我有一个以下形式的字符串: 发送=“软件开发=1831”。 我只想从字符串中提取单词,即“软件开发”。 我如何在 Python 中提取它。

回答 3 投票 0

Halcon - 提取板条箱区域

我很难从这张图像中提取黑色板条箱的区域。 我的情况是这样的: 蓝色是我预先定义的区域,因为它大致是板条箱所在的位置。 ...

回答 1 投票 0

如何将pyPDF2的输出保存到Excel文件中?

以下代码打印我需要的内容(格式并不理想,但如果我能找到如何另存为 Excel 文件,这可能无关紧要)。 对于范围 (3,167) 内的 i: 打印(reader.pages[i].extract...

回答 1 投票 0

C# 摘录,可从源中删除与秒内一样多的记录

我们有两个数组 arr1 = [1, 1, 1, 2, 3] arr2 = [1, 2] 我正在寻找接受这两个集合并返回的 Linq(不必要)方法; [1,1,3] 问题是 Intersect 返回...

回答 2 投票 0

python 上的 pybig 模块

.big 文件被称为 EAgames 档案。 大文件可以通过 xcc 混合器程序在内部提取,但我正在编写代码通过 Python 提取它们。 我安装了 Python 3.11.3 并...

回答 1 投票 0

如何在 Azure Functions 中使用 Python keynote-parser

我正在尝试使用名为 keynote-parser 的外部模块从 Mac Keynote 文件中提取数据。当我在本地 Mac 笔记本电脑的终端中用作命令行时,它可以工作。我正在努力

回答 1 投票 0

无法抓取包含使用 selenium 的机构的弹出窗口的网页

我已经废弃了该网站 https://www.whed.net/results_institutions.php 我的问题是,我可以从下拉列表中选择国家/地区名称,然后单击“确定”以获得结果。 ...

回答 1 投票 0

Python BeautifulSoup 从 html 文件中提取元素

我是 BeautifulSoup 的新手,想用它来提取元素 98.2% 和 94.2%。 我想打印: 苹果:98.2% 香蕉:94.2% 我该怎么做?提前致谢。 <... 我是 BeautifulSoup 的新手,想用它来提取元素 98.2% 和 94.2%。 我要打印: 苹果:98.2% 香蕉:94.2% 我该怎么做?预先感谢。 <div> <table class="stock"> <tr> <th></th> <th scope="col">Equal</th> <th scope="col">Total</th> <th scope="col">Fruits</th> </tr> <tr> <th scope="row">apples:</th> <td>524</td> <td>525</td> <td class="high">98.2%</td> </tr> <tr> <th scope="row">pears:</th> <td>58</td> <td>58</td> <td class="high">100.0%</td> </tr> <tr> <th scope="row">bananas:</th> <td>165</td> <td>179</td> <td class="high">94.2%</td> </tr> </table> 最初,我尝试了以下方法,但它打印出来: [98.2%、100.0%、94.2%] from bs4 import BeautifulSoup HTMLFile = open("stock.html", "r") index = HTMLFile.read() soup = BeautifulSoup(index, 'html.parser') element = soup.select(".stock .high") print(element) 尝试: from bs4 import BeautifulSoup html_text = """\ <table class="stock"> <tr> <th></th> <th scope="col">Equal</th> <th scope="col">Total</th> <th scope="col">Fruits</th> </tr> <tr> <th scope="row">apples:</th> <td>524</td> <td>525</td> <td class="high">98.2%</td> </tr> <tr> <th scope="row">pears:</th> <td>58</td> <td>58</td> <td class="high">100.0%</td> </tr> <tr> <th scope="row">bananas:</th> <td>165</td> <td>179</td> <td class="high">94.2%</td> </tr> </table>""" soup = BeautifulSoup(html_text, "html.parser") for tr in soup.select('tr:-soup-contains("apples", "bananas")'): print(tr.th.text, tr.find(class_="high").text) 打印: apples: 98.2% bananas: 94.2%

回答 1 投票 0

如何提取 .jar 文件并创建 100% 相同的新文件

当我读到有关修改 version.jar 文件来修改你的游戏时,我正在摆弄 Minecraft 版本文件。我开始尝试一些东西,但几乎立刻就陷入了困境。 我在 Mac 上工作

回答 2 投票 0

提取网格对象下的单元格值和单元格比例,然后在Terra(R中)中查找高于某个值的单元格比例

我正在使用代表草本覆盖百分比的 30m 分辨率栅格。我正在尝试确定每个 1km 网格单元内值大于 10 的单元数量(代表...

回答 1 投票 0

如何首先对齐,然后提取 - 使用 RetinaFace 进行人脸对齐,没有黑色区域

提取的图像样本我正在尝试使用 RetinaFace 进行人脸检测、人脸对齐、人脸提取和文件裁剪,以应对头部倾斜或处于垂直以外的其他位置的情况...

回答 1 投票 0

如何在 raster::extract() 中传递多个函数

我正在使用栅格 CHM,并且必须从多边形形状文件中提取多个指标。现在我正在做这样的事情: 库(光栅) 图书馆(sp) #来自extract的帮助页面 <- ra...

回答 3 投票 0

BATCH:我想在文本文件中提取一个被单词包围的“表格”,并将这唯一的“表格”复制到新的文本文件中

我真的是批处理新手,需要帮助...我的目标是读取文本文件中的数据表,然后以相同的格式将其复制到另一个文本文件(output.txt)中。然而,第一篇文章中的表格...

回答 1 投票 0

提取存档条目将创建一个位于指定目标目录之外的文件

当尝试提取 .jar 文件时,我不断收到: 提取存档条目将创建一个位于指定目标目录之外的文件 谁能帮我?这是我的代码: 尝试...

回答 3 投票 0

使用循环从R中的库中提取气候信息

我有一个相当大的数据库。我需要从“Nasapower”库中提取气候信息。 我的缩减数据集如下所示: api_decimal<- data.frame ( AP_COD = c("L...

回答 1 投票 0

Excel,从多列中提取重复项

有没有办法从3个不同的列中提取重复项? 假设我有 A 列 B 列 C 列 ID1 ID4 ID7 ID2 ID5 ID8 ID3 ID6 ID9 ID98...

回答 1 投票 0

Python 中文本查找和替换的问题

我有非常具体的功能。我有 2 个字符串,一个是代码输入的备份,第二个是通过替换空格、提取信息等步骤进行修改的(不重要...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.