text-processing 相关问题

机制化电子文本的创建或操作。

如何使用python regex从不同类型的日期格式的文本中提取日期

我正在执行ocr问题,我有500张图像,并且已经从图像中提取了文本并另存为CSV,因为该文本具有不同的日期格式,所以我想提取日期。从那个文本。 ...

回答 2 投票 0

如何使用python regex从不同类型日期格式的文本中提取日期

我正在做ocr问题,我有500张图像,我已经从图像中提取了文本并另存为CSV,在该文本中,日期格式不同,因此我想从该文本中提取日期。 ...

回答 2 投票 0


从文本中提取单词并从中创建向量

[假设我有一个包含以下文本的txt文件:类型:水果标题:零售日期:2015-11-10国家:英国产品:苹果,百香果,芒果文档:NDA导出:2.10我阅读了此文件.. 。

回答 1 投票 -1

vim中的十进制数字乘以固定数量

我有一个具有以下内容的文件:设置x 0.00456 y 0.05896。我想将数字乘以固定的数量(比如说1000)。数字并不总是存在于同一列中,所以任何内容都可以...

回答 1 投票 0

spacy-lookup标点干扰

Spacy-lookup是非常大的词典的实体匹配器,它使用FlashText模块。在下面的第二种情况下,标点符号似乎阻止了它与实体的匹配。有人吗...

回答 1 投票 0

如何分割由R中的点连接的两个单词?

我有一个包含新闻文章的大型数据框。我注意到有些文章用点将两个单词连接起来,如以下示例所示。政府表示必须退出。.I ...

回答 1 投票 0

当键/值是某些东西时,如何仅打印某些文本块?

因此,如果我有类似这样的信息,我只想在“帐户已禁用:错误”时捕获或打印出帐户信息。 $ ipa用户查找---------------匹配2个用户---------------用户登录:...

回答 2 投票 0

圈出单词并提取双字母组

我想从给定的单词中提取每个双连词,并放入一个文本文件中。例如:苹果->苹果公司总裁->我发现的总统身份...

回答 3 投票 0

从名词中获取口头名词

言语名词是由动词形成或对应于动词的名词。我正在寻找一种算法,当给定一个名词时,它会返回相应的动词(如果输入的名词是语言……

回答 1 投票 1

是否可以使用python交换文本文件中的两行文本?

[我正在尝试编写一个python脚本,该脚本将接收一个文件(将其称为input.txt),并寻找以文本“移至第一个边界点”结尾的行。然后它需要替换此行...

回答 1 投票 -5

文本处理忽略下划线的第二次出现

数据从下划线的第二次出现中将被忽略,应对此进行排序,并且需要消除重复。 awk -F_'{print $ 2}'file1 >>文件2;排序文件1 | uniq;我尝试了****** FROM ** ...

回答 1 投票 -1

从文档中读取多行行并执行操作

我有一个试图在主文档上运行的脚本。该脚本将查看带有完整文件名和路径并用双引号引起来的txt文档。然后,它使用文件名和父文件夹(...

回答 2 投票 0

如何捕获特定字符之前和之后的所有组

我正在尝试捕获所有之前的小组;我还需要捕获没有以;结尾的最后一组。这是我的声明和代码。正则表达式:(((\ * | \ / | \)| \(| [-+] \ d + | [-+]?\ d * \。\ d + | \ d + | \ ...

回答 2 投票 0

如何从Python数据中删除多余的逗号

我有一个CSV文件,通过该文件我试图将数据加载到包含2列的SQL表中。我有2列,数据用逗号分隔,标识下一个字段。第二列...

回答 2 投票 -1

使用正则表达式分隔文本/文本处理

我有一个段落,需要用特定的关键字列表分隔。这是文本(单个字符串):“评估注释:怀疑是自己母亲的虐待。日期3/13/2019 ID:#N / A联系人:不...

回答 2 投票 0

从python单词包中搜索文本

假设我有很多关键词。例如:['利润低','亏损增加','利润降低']我有一个pdf文档,我从中解析了整个文本,现在我想得到匹配...

回答 3 投票 0

如何在多个文件上使用awk?

我正在使用Linux。我写了一些看起来像这样的代码:对于{10..20}:{00..59}中的x;做awk -F';' '/'“ $ x”'/ {y + = $ 7} END {print y}'Data26092019;完成了如何在多个文件上使用此命令,例如...

回答 1 投票 0

使用另一个列表作为参考隔离并追加列表中的项目

我尽力弄清楚如何将一个列表中的项目附加到新列表中。列表中的数据实际上是来自ipconfig / all的信息。因为我想将各部分中的项目分开...

回答 1 投票 0

是否有用于比较两个文本数据集的Python函数?

数据集:我有两个不同的文本数据集(用于训练和测试),每个数据集包含30,000个句子。一部分数据如下:“富尔顿县大陪审团在星期五说...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.