text-parsing 相关问题

文本解析是解析的一种变体,它指的是将文本流分解为不同组件并捕获这些组件之间关系的操作。

从标准输出中修改字符串中的数值

我具有要重写和修改某些数字值的输入字符串:输入:src / main.tsx(2,31):错误TS2304:找不到名称'foo'。所需的输出:src / main.tsx:1:30:错误:...

回答 1 投票 0

可以使用正则表达式在定界符对之间查找文本

我需要解析电子邮件模板以获取在成对的美元符号之间出现的自定义变量,例如:$ foo $ bar $ baz $ foo $ bar $ baz $ wtf它来了...

回答 2 投票 1

使用PyParsing的两个标记之间的字符串

我需要使用PyParsing获得两个标记之间的字符串。我想从字符串s ='qwertyAAA1234ZZZazerty'中检索AAA和ZZZ之间的字符串,即1234。到目前为止,我已经可以做到...

回答 1 投票 0

python-asn1将文本解析为json

使用此链接中的文本,需要按以下方式提取数据:每条记录均以YYYY Mmm dd hh:mm:ss.ms开头,例如2019 Aug 31 09:17:36.550每条记录 的标题均从第1行开始...

回答 1 投票 0

如何将文本文件内容添加到文本文件包含空格的组合框中?

我想在Swing组合框中添加文本文件内容。我需要每一行作为组合框中的每个元素。但是文件在单词之间包含空格。因此它在空白处通过单独的...

回答 1 投票 0

Python-解析半结构化文本并提取为结构化数据

具有如下所示的半结构化数据,需要将特定部分转换为结构化数据以进一步使用%MOBILE PARSED MESSAGE FILE%PARX VERSION:PARX 06.30.80 patch 69%RAYN VERSION:...

回答 1 投票 0

在Python中解析文件时跳过一行?有简单/基本的方法吗?

我正在尝试逐行解析文件并将其编辑/将其存储在数组中,然后将其转储到具有编辑内容的文件中。但是在解析文件时,如果遇到特定的问题...

回答 3 投票 1

如何将加引号的字符串作为URL输入的一部分正确传递给httr:GET()?

假设我希望将这样的URL传递给httr :: GET():https://www.uniprot.org/uniprot/?query=name%3A"dna+methyltransferase“我将如何获得引用此字符串的一部分(即“ dna + ...

回答 2 投票 0

Java简单行解析器

我可以看到一堆Java解析器,例如OpenCSV,antlr,jsapar等,但是我看不到能够同时指定自定义行分隔符和列分隔符的那些解析器吗?我们是否有任何这种易于使用的...

回答 2 投票 -2

解析未知格式的文件时检索列边界是个好主意吗?

想象一下,我们有一些带有* .unknown扩展名的文件需要解析。不幸的是,我们不知道该如何解析...即没有超级解析器或简单的'由空格分隔的...

回答 1 投票 0

分割一个唯一的字符串-Python

我正在尝试解析这种类型的字符串的最佳方法:'运行状态:未授权退出使用日期:无'我需要这样的输出:['运行状态:未授权',' ...

回答 1 投票 -1

从python单词包中搜索文本

假设我有很多关键词。例如:['利润低','亏损增加','利润降低']我有一个pdf文档,我从中解析了整个文本,现在我想得到匹配...

回答 3 投票 0

将文本文档/字符串转换为Python中的数据框

我已使用Apache tika从PDF中提取了此文本。我想以这种方式拆分文本,使每个问题/答案仅得到一行。最终结果必须是表格结构。这是...

回答 1 投票 1

使用C Sharp解析嵌套文本

如果我有一系列具有以下基本格式的字符串:“ [id value]” // id和value以空格分隔。 id永远不会有空格,然后可以像这样嵌套:[a] [a [b值]] [a [b [c [...

回答 4 投票 1

将结构化文本/ Lua文档解析为字符串或表

我想将以下结构化Text / Lua文档的数据存储在Java表中,我该怎么做,是否有用于Lua结构的解析器?还是Java中有一个解析器,可以从{...

回答 1 投票 0

开源库解析为目的的文本和实体,如Alexa的自定义技能

是否有类似的工作,你为它提供一个意图的模式和样品话语相匹配,它会提供一个解析标记化响应亚马逊的Alexa自定义技能的任何开源库...

回答 4 投票 3

C# - 读取文件到列表和分裂的分隔符

我有我需要从拉个体值的文本文件。这方面的一个例子是:名称:李四密钥长度:3 a90nm84ang9834n 90v84jgseidfrlg f39048s9ipu4sdd随机:真的,我需要我的...

回答 1 投票 -3

如何从文件中解析多种形式的数据?

如果网上有很多关于这个的信息,我很抱歉...我不知道为什么,但我似乎无法将所有内容拼凑在一起,这让我感到沮丧。我正在完成一项任务......

回答 1 投票 0

PySpark 2.4 - 使用自定义行分隔符读取CSV文件

2017年,我们在spark中添加了对自定义行分隔符(针对各种文本文件格式)的支持(请参阅:https://github.com/apache/spark/pull/18581)。 ......或者也许它没有在2017年添加 - 或者永远(见:......)

回答 1 投票 0

NN VBD IN DT NNS RB在NLTK中意味着什么?

当我分块文本时,我在输出中得到了很多代码,如NN,VBD,IN,DT,NNS,RB。是否有某个列表记录在哪里告诉我这些的含义?我试过谷歌搜索nltk块代码...

回答 3 投票 17

© www.soinside.com 2019 - 2024. All rights reserved.