extraction 相关问题

数据提取是从(通常是非结构化的或结构不良的)数据源中检索数据以进行进一步数据处理或数据存储(数据迁移)的行为或过程。

在多个powerpoint文件Python中查找单词

我有很多pptx文件要在目录中搜索,我正在寻找这些文件中的特定单词“data”。我创建了下面的代码,它读取所有文件,但它没有提供正确的...

回答 2 投票 0

从静态库中提取函数名称

我有一个静态库static_library.a如何列出那里实现的函数和方法。或者至少如何看待“FUNCTION_NAME”实现的具体功能?

回答 3 投票 15

身份证明文件中的命名实体识别

我正在尝试为驾驶执照等文件中的文本执行命名实体识别(NER)。我们从文档中提取了文本。我们的目标是找到哪个文本是名称,......

回答 1 投票 0

使用ifcopenshell从IFC文件中提取信息

我正在使用ifcopenshell从IFC文件中提取数据。直到现在我已经提取了所需的实体,即我从建筑模型中提取了结构模型。但现在......

回答 1 投票 0

如何使用PySpark在桌面上的本地文件夹上的目录中并行处理文件(pdf,docs,txt,xls)?

我在本地桌面上的单个目录中有大约9000个不同子目录中的文件。目录的总大小约为15GB。我不想通过python编程方法,...

回答 1 投票 -1

笔画宽度变换(SWT)实现(Java,C#...)

我最近发现了笔画宽度变换,如以下研究论文中所述:使用笔画宽度变换检测自然场景中的文本。 Boris Epshtein,Yonathan Wexler和......

回答 2 投票 16

如何将两个可执行文件打包成一个可执行文件,然后解压缩并运行它们?

在Windows中,我可以使用哪些软件,因此我可以将两个可执行文件打包到另一个可执行文件中,然后如何让其他可执行文件解压缩两个可执行文件并运行它们...

回答 1 投票 -1

R:匹配存储在数组中的字符串与另一个数组的字符串

我有不同的字符串(一个字符串可能包含~1-4个字)存储在一个大字符对象(总共38506个元素)和一组10个文本存储在一个chr-Object(每个约100个字)中,可能......

回答 1 投票 2

正则表达式提取字段

我想提取URL的一些部分并保存在捕获组L_URL中,例如从http:// al开始,直到下面的示例事件中的m3u8,问题是两个事件都在...

回答 1 投票 -4

子集变量的显着P值

我试图通过显着的P值来对变量进行子集化,并尝试使用以下代码,但它只选择所有变量而不是按条件选择。任何人都可以帮我纠正......

回答 1 投票 2

如何打印具有满足范围值的列?

我有一个包含数千列和行的大表。但是为了简化起见,假设我有一个包含11行和100列的表。表格单元格包含介于0和...之间的值

回答 3 投票 2

需要仅使用imacros在html页面上提取部分文本

我正在尝试在Html页面中提取一部分文本,其中充满了令人困惑的标签。我将尝试更好地解释我的问题:这是html页面的源文件HTML SOURCE IMAGE这是......

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.