text-extraction 相关问题

文本提取是从非结构化和/或半结构化机器可读文档(文本)中自动提取结构化信息的任务。

tesseract中以下代码的字典输出的键值表示什么?

我正在python中使用以下代码:我正在字典中获取以下键值:'block_num''conf''level''line_num''page_num''par_num','text','top','宽度','word_num','...

回答 1 投票 0

有没有更有效的方法来找到子字符串结尾的索引?

我正在读取XML标记以尝试从中提取值: 我想提取三个字母的代码por。标记中可能还有其他属性,所以我当前的...

回答 1 投票 0

如何从PDF提取文本时添加字幕?

我正在尝试对一组pdf文件运行LDA,以访问这些文件中的主要主题。我可以使用pdfminer从pdf提取数据。问题1:但问题是字幕和...

回答 1 投票 2

如何将Amazon Textract与PDF文件一起使用

我已经可以使用textract但可以使用JPEG文件。我想将其与PDF文件一起使用。我有下面的代码:import boto3#Document documentName =“到JPEG中的文档的路径”#读取...

回答 2 投票 0

使用Python提取原始文本文件中的正负浮点值

所以我试图从这样的原始文本文件中提取某些值零列数:4内存需求-全局矩阵:1571340解算器(总计):1571340 P1127_VELOCITIES#001000步骤:...

回答 1 投票 0

是否可以使用pytesseract从图像的特定部分提取文本

我在图像中具有边框(矩形的坐标),并希望在该坐标内提取文本。如何使用pytesseract在该坐标内提取文本?我尝试复制图像...

回答 1 投票 -1

是否有R函数在特定单词后提取数值?

寻找R中从数据表中提取以下内容的方法。我想把数字取磅之前。数据字段在“ ####磅”之前和之后都杂乱无章。...

回答 1 投票 -1

[使用Python从多个图像文件中提取文本

我有一个包含多个图像文件的文件夹。我想从这些文件中提取文本,并将输出保存为csv文件,其中包含2列,第一列:Image_no。,第二列:Text。我有TIA ...

回答 1 投票 0

如何使用python从特定关键字中提取有限的数据行

我有一个文本文件,我需要在其中提取前五行中指定的关键字出现在段落中。我能够找到关键字,但不能从该关键字写下五行。 ...

回答 2 投票 0

在Power BI DAX中搜索特定单词并将其提取到新列中

[Atm我的数据就像下面的句子列表:FPTS是我们的(案例ID)列FPTS-0009:软件更新所需的帮助已帮助并且客户在做前端FPTS-0012这次是客户...

回答 1 投票 0

有没有功能可以解析Python中的完整SQL查询?

我正在使用postgreSQL查询。我想从SQL查询中提取所有信息,例如sql =“ select d_year,s_nation,p_category,sum(lo_revenue-lo_supplycost)作为DATES的利润,...

回答 1 投票 1

选择关键词之间的文字

这是选择文本块并合并到新文档中的后续问题,我有一个SGM文档,其中添加了注释,并在sgm文件中添加了注释。我需要提取之间的字符串...

回答 1 投票 0

如何从段落中提取信息?

我是Python的新手,现在我正尝试从一组包含员工统计信息的段落中提取信息。或示例,该段将如下所示:名称Rakesh Rao ...

回答 5 投票 0

如何从段落中提取信息?

我是Python的新手,现在我正尝试从一组包含员工统计信息的段落中提取信息。或示例,该段将如下所示:名称Rakesh Rao ...

回答 5 投票 0

Python从段落中提取信息

我是Python的新手,现在我正尝试从一组包含员工统计信息的段落中提取信息。或示例,该段将如下所示:名称Rakesh Rao ...

回答 5 投票 0

如何从文档中提取许多标题

我正在一个项目中,我需要从Word文档的pdf中提取几个主题标题,这些标题将用作搜索的关键字。因此,是否有任何算法可以...

回答 1 投票 0

如何使用Azure Functions提取PDF文件的文本?

我想创建一个Azure函数,该函数在将文件上传到Blob存储并提取PDF文件的文本时触发。我不知道哪种方法最适合使用。我...

回答 1 投票 1

在SAS中使用正则表达式拉字符串

我有这样的字符串:HAHDFKDLFDAFHDKFJL / ABCD // NAME /我想在其他时间提取此/ JJJJ // NAME /等等等等,该字符串看起来像这样的HAHDFKDLFDAFHDKFJL / ABCD // NAME / I WANT TO EXTRACT ...

回答 2 投票 0

正则表达式从文本文件中提取文本块?

我需要使用正则表达式从Python的文本文件中提取标题及其下的文本块,但我发现这很困难。我将此PDF转换为文本,因此现在看起来像...

回答 1 投票 0

提取与命名实体组织相关的人员是否可行?

我是文本提取的新手,我想从文本和与公司相关的人员中提取公司名称。我正在考虑使用Spacy提取这些单独的部分,但是我不确定...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.