text-extraction 相关问题

文本提取是从非结构化和/或半结构化机器可读文档(文本)中自动提取结构化信息的任务。


在Anylogic中,您如何提取对象的名称,以便我可以使用它并将其分配为Text值? (对象>>文本)

问题:代理程序具有一个引用对象的参数(比如说INode)。我想获取并使用该INode的名称作为纯文本,而无需编写将INode映射到它们的函数...

回答 1 投票 0

从跨度提取文本

我对没有ID或类的span标签有问题。较大的方法是从下面的链接中提取“项目1。业务”与“项目1A。风险因素”之间的文本。但是,我不能...

回答 1 投票 0

用漂亮的汤汁提取文本(Python)?

我对没有ID或类的span标签有问题。较大的方法是从下面的链接中提取“项目1。业务”与“项目1A。风险因素”之间的文本。但是,我不能...

回答 1 投票 0

批处理文件-从日志文件中提取文本

我需要从日志文件中提取主机密钥,然后通过批处理文件将其放入变量中,以便可以将其输出到另一个文本文件中。我知道如何逐行读取文件,但不知道如何...

回答 1 投票 -2

为什么阅读PDF时页面内容混乱?

我正在使用iText7从pdf文件中读取文本。这对于第一页工作正常。之后,页面的内容会以某种方式混淆。因此,在文档的第3页上,有几行...

回答 1 投票 3

XPath从嵌套Div提取特定文本

我正在尝试使用Sfroging Frog从嵌套的div中获取包含“ 2020”的URL的列表。我应该使用什么XPath?我不擅长XPath。我尝试了一些,但没有奏效。我正在尝试...

回答 1 投票 0

如何使用正则表达式提取器提取文本值

我正在尝试从一个句子中提取一些文本值,但是我什么也没得到。请帮助我摆脱困境。下面是图像并标记为红色,我需要提取该文本值,...

回答 1 投票 0

从(Edgar 10-K档案)HTML中提取文本部分

我正在尝试从HTML文件中提取特定部分。具体来说,我要查找10-K申请(某家公司的美国业务报告)中的“ ITEM 1”部分。例如:https://www.sec.gov / ...

回答 1 投票 1

如何从图像表格中提取文本?

我具有结构化表格图像中的数据。数据如下所示:我尝试使用以下代码从此图像中提取文本:从PIL导入pytesseract导入图像value = Image.open(“ data / ...

回答 2 投票 1

命令行提取文件中引用的所有域名

我需要一种方法来提取包含URL的文件中的所有域名(我不在乎完整的URL)。输入:

回答 4 投票 2

从熊猫df中提取数据到列表中

我有一个Pandas数据框,其标题和行包含冗余数据,并希望从中提取数据。例如,我有一个如下所示的df:df = pd.DataFrame({'您的可用性:...

回答 2 投票 1

从PDPage提取文本(PDFbox库)

我有一个从整个PDDocument对象中提取文本的函数,因为PDFTextStripper接受PDDocument而没有一个接受PDPage到gettext的函数,所以我一直在了解如何...

回答 1 投票 -1

使用python从MS word docx文件中提取分页文本

我正在尝试使用python从MS Word文档文件中提取分页文本。我看过python-docx文档和功能,我们可以从docx文件中提取所有文本。但是我需要提取...

回答 1 投票 1

如果类不同并且包含不同的内容,如何从类中提取内容并将它们按时间顺序添加到列表中?

我有2种方案,在抓取代码时需要以不同的方式处理。 2个相似的类都包含建筑物的价格,因此需要按时间顺序添加到excel中,因为它们具有...

回答 2 投票 0

使用Python进行PDF解析-提取格式化和纯文本[关闭]

我正在寻找一个PDF库,它将允许我从PDF文档中提取文本。我看过PyPDF,它可以很好地从PDF文档中提取文本。问题是...

回答 2 投票 81

从还提到卧室数量的字符串中提取平方米的最佳方法是什么?

我正在尝试提取: 84平方米2床。 来自链接...

回答 1 投票 0

重复定界符并提取它们之间的字符串

我对Python和正则表达式是相当陌生的,并且我希望从html文件中提取信息。假设以下是html文件中给出的一行(因为html不会“看到” ...

回答 1 投票 0

我如何从具有div嵌入beautifulsoup4的div中获取第一个字符串

我正在尝试从网站上提取价格。我编写的代码可以做到这一点,但是当网站的价格也显示旧价格时,它返回“ none”而不是价格字符串。 ...

回答 1 投票 0

根据R中的特定字词和后面的百分号提取字符串或值

我有一个包含数千行段落的Text列,我想提取“ Capacity> x%”的值。运算符可以是>,

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.