parsing 相关问题

解析是指将工件分解为其构成元素并捕获这些元素之间的关系。此标记不是关于自托管Parse平台(使用[parse-platform]标记)或解析特定编程语言中的错误的问题(而是使用相应的语言标记)。

使用 ruby 核心库解析 HTML? (即不需要宝石)

我和一些朋友一直在研究一组脚本,使在大学的机器上工作变得更容易。这些工具之一当前使用 Nokogiri,但为了使这些工具能够在所有

回答 1 投票 0

将列的值转换为带有欧洲分隔符的数字

考虑这个示例数据框 df_1: 索引值_1 1 -3.570,00 2 +552,76 3 -1,01 4 -100.234,01 其中浮点值有符号,以及欧洲分隔符/分隔符

回答 3 投票 0

使用 sscanf 解析/标记 csv 文件?

我目前正在尝试使用 sscanf 解析 .csv 文件。我创建了一个函数来检测行开头的引号。 int checkString(const char *str) { if (str[0] == '"') { 重新...

回答 1 投票 0

如何将 HTML 拆分成行并在 TypeScript 中保留 HTML 结构?

我已经为此苦苦挣扎了很长一段时间,所以如果有人能帮助我,我将非常感激。我想将 HTML 分成几行(在 字符),但也保留每个文本节点,并且...

回答 1 投票 0

Pyspark - 解析多个正斜杠之间的日期

我有一个包含多个列的 Spark 数据框,我想将其中一列解析为单独的列。对于以下两行,预期输出如下: 'www.freela...

回答 1 投票 0

用plotly/dash html组件替换一些文本周围的html标签

我有一个html文件,内容是一个表格,例如: 第 1 项 我的定义... 我有一个html文件,内容是一个表格,例如: <tr> <td> <p>Item 1</p> </td> <td> <p>Definition for Item 1.</p> <p>This may contain several paragraphs.</p> </td> </tr> <tr> <td> <p>Item 2</p> </td> <td> <p>Definition for Item 2.</p> <p>This may contain several paragraphs.</p> <p>And another paragraph here.</p> </td> </tr> 我正在尝试创建一个看起来像这样的字典(使用dash html组件): items_dict = { 'Item 1': html.Div([ html.P("""definition for Item 1"""), html.P("""This may contain several paragraphs."""), ]), 'Item 2': html.Div([ html.P("""definition for Item 2"""), html.P("""This may contain several paragraphs."""), html.P("""And another paragraph here."""), ]), } 你会怎么做? 如有任何指点,我们将不胜感激。 谢谢你, 大卫 一些背景:我有一个包含近 100 个项目及其定义的表格。我正在尝试创建一个 pythonique 对象,我可以根据项目名称(字符串)进行搜索。 我的项目/定义位于 Word 文件中,我已使用 Mammoth 包将其更改为 HTML 文件。 但是,可能有更好的方法以编程方式执行此操作。 这是一个如何使用 beautifulsoup 将 HTML 解析为普通字典的示例。 然后您可以将字典转换为您需要的对象。 from bs4 import BeautifulSoup html_text = """\ <tr> <td> <p>Item 1</p> </td> <td> <p>Definition for Item 1.</p> <p>This may contain several paragraphs.</p> </td> </tr> <tr> <td> <p>Item 2</p> </td> <td> <p>Definition for Item 2.</p> <p>This may contain several paragraphs.</p> <p>And another paragraph here.</p> </td> </tr>""" soup = BeautifulSoup(html_text, "html.parser") out = {} for row in soup.select("tr"): header, *definitions = row.select("td") header = header.get_text(strip=True) for p in definitions[0].select("p"): out.setdefault(header, []).append(p.get_text(strip=True)) print(out) 打印: { "Item 1": ["Definition for Item 1.", "This may contain several paragraphs."], "Item 2": [ "Definition for Item 2.", "This may contain several paragraphs.", "And another paragraph here.", ], }

回答 1 投票 0

使用复制模式在 Python 中进行 XML 解析

我有以下 xml 文件,希望从 Excel 电子表格导入数据,并将其放置在某些元素(例如 eadid 和 titleproper)之间。我已经尝试过附加的Python代码,但是这个

回答 1 投票 0

如何在 Jackson 中将 JSON 字符串解析为 JsonNode?

本来应该这么简单,但是我试了一个小时还是找不到。 我需要获取一个 JSON 字符串,例如 {"k1":v1,"k2":v2},解析为 JsonNode。 JsonFactory

回答 7 投票 0

如何从Stanza选区解析树中获取字符串中的原始标记位置?

我正在使用 Stanza 从文本中提取名词短语。我正在使用此代码来提取 NP 并根据其深度存储它们。 nlp = stanza.Pipeline('en', tokenize_pretokenized=True)

回答 1 投票 0

解析具体消息输入及原因

我有一个以下格式的日志文件 消息暂停的原因 消息 穆吉 对数 = 原因1 味精1 117 62.575 1440 原因2 味精1...

回答 1 投票 0

与“未定义”相关的错误不是有效的 JSON

嗨,团队我正在开发社交媒体应用程序。我正在测试我的登录页面功能。然后我遇到了截图中的错误,我附上供您参考。请帮我解决这个问题,我很困惑...

回答 1 投票 0

是否可以使用 fparsec 解析“越位”(基于缩进)语言?

我希望将 FParsec 用于基于缩进的类似 python 的语言。 我知道这必须在词法分析阶段完成,但 FParsec 没有词法分析阶段。可以使用 FParsec,或者,...

回答 1 投票 0

在 R 中解析 lsf.str 输出

lsf.str函数返回函数名称和描述,例如如下: 函数名称 <- lsf.str(envir = asNamespace("dplyr"), pattern="count") func_names The output f...

回答 1 投票 0

基于 where 条件下的一个日期列创建 2 列

我想根据 StatusCode 的 where 条件将日期列解析为 2 列。 我的查询是: 选择订单 ID、状态代码、日期戳 来自 xyz,其中 StatusCode =“已发货” 左连接

回答 1 投票 0

如何在Python中解析类似xml的文本文件?

我有一个类似 XML 语言的文本文件,如下所示: ...

回答 1 投票 0

原生 JS 中的 DXF 解析器

我目前正在做一个CNC项目,我希望能够将DXF文件解析为JS中的对象。 我开始使用 SVG,但绘图并未导出为形状,而是导出为线条(一个正方形为 4 个

回答 2 投票 0

如何抓取连字符之间的数据?

我对 SQL 世界和使用 Microsoft SQL Server Management Studio 相当陌生。我可以操作一些给我的查询示例,但当我不理解这些功能时就不行。我正在尝试...

回答 3 投票 0

在python中使用ttp模块忽略数据

我将通过以下示例解释我遇到的问题。我可以使用以下配置解析以下数据。当我使用 {{ignore}} 命令时,它可以帮助我获取该行...

回答 2 投票 0

为什么我收到 AttributeError dict_keys object has no valueappend?

从这段代码中,当我将变量分配为循环上方的列表(release_list.append)时,为什么我会收到 dict_keys 属性错误,我相信这可能是缩进错误,因为它是

回答 1 投票 0

fgetcsv(),在 csv 字符串中包含 html 实体

我解析 CSV 字符串并收到错误的列数,我认为这是因为像 %2C%20 这样的 html 实体。 我收到错误的列数,我认为这是因为像这样的 html 实体...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.