data-extraction 相关问题

数据提取是从(通常是非结构化的或结构不良的)数据源中检索数据以进行进一步数据处理或数据存储(数据迁移)的行为或过程。

如何从文本文件中提取数据并将其添加到列表中?

这里是Python菜鸟。我有这个文本文件,其中的数据以特定方式排列,如下所示。 x = 2,4,5,8,9,10,12,45 y = 4,2,7,2,8,9,12,15 我想从中提取 x 值和 y 值...

回答 3 投票 0

如何在scrapy中发送带有标头和有效负载的Post请求

我正在尝试向 Graph API 发送发布请求,并且成功了,但我想在 scrapy 中发送相同的请求,但我不知道如何在 scrapy 中发送带有标头和有效负载的发布请求。

回答 1 投票 0

使用 API 调用在 Salesforce Marketing Cloud 上的空数据扩展中插入行

我没有实现通过使用API多数据扩展行方法接收我的数据扩展(空)中的数据。 我创建了一个包含 7 个变量的数据扩展(6 个数据类型 = 文本,1 个是日期)。上...

回答 1 投票 0

提取 Locoscript 数据

我需要从 Locoscript 文件中提取数据。我有一台运行 Windows XP 的计算机,因此我可以读取数据。你能帮我吗?谢谢。 我尝试过在写字板和 Excel 中打开。我可以阅读文字,但是

回答 1 投票 0

如何使用python从whatsapp web中提取二维码?

我尝试使用 python 和 selenium 提取二维码并且能够提取,但有时二维码无法加载。 从硒导入网络驱动程序 从 selenium.common.exceptions 导入

回答 2 投票 0

在 Python 中打印大型 JSON 文件的前几行

我有一个JSON文件,大小约为5GB。我既不知道 JSON 文件的结构,也不知道文件中根的名称。由于文件大小,我无法在本地计算机中加载该文件...

回答 2 投票 0

将 Google 文档评论以及突出显示的文本导出到 Google 表格中?

是否有一种方法可以从 Google 文档导出评论,以便评论显示在 Google 表格文档的一列中,而 Google 文档中突出显示的文本显示在下一列中...

回答 2 投票 0

在Python中使用7zip压缩时如何不包含整个路径?

我有一个 C:/a/b/c/d,我只想压缩文件“d”。当我使用 py7zr 库在 Python 中执行此操作时 存档 = py7zr.SevenZipFile('C:/a/b/c/d.7z', 'w') archive.writeall('C:/a/b/c/d') 存档.c...

回答 2 投票 0

安装“qd”库时出错!我们如何读取或操作 LS Dyana 的密钥文件?

目标:我有 .Key 文件,用于预处理 LS Dyna 模拟的数据文件。我想从该 .Key 文件中提取位于特定部件 ID (PID) 下的特定节点号。 为了达到以上g...

回答 1 投票 0

如何从 .h5 文件中提取数据并将其正确保存在 .txt 或 .csv 中?

经过大量搜索后,我找不到一种简单的方法来从 .h5 中提取数据并将其传递给 Numpy 或 Pandas 的 data.Frame 以保存在 .txt 或 .csv 文件中。 导入 h5py 将 numpy 导入为 np 小鬼...

回答 2 投票 0

AWS Textract无法识别PDF文档第二页的表格

我需要使用 AWS Textract 从账单副本中提取表格信息。它每次都给我几乎完美的结果,但对于某些 PDF 文档,它没有给我 sec 的表格结果......

回答 1 投票 0

使用Pypdf2从网页转换的pdf中提取文本。

我使用chrome将一个网页转换为Pdf,使用保存为pdf选项。现在的问题是,当我使用PyPDF2提取数据时,它显示为Null,而在其他pdf文件上却很容易工作。I ...

回答 1 投票 0

无法在R中进行forloop

嗨,我有一些PDF文件保存在一个文件夹中。每个PDF文件都有一些货币价值开始$,我想提取每个文件中的第一个货币价值,我能够做到这一点。

回答 1 投票 0

从不同格式的pdf发票中提取数据。

目的是提取pdf格式的发票数据。Pdf数据格式:可选择的文本(不是扫描的图片)由文本行、名值对、表格(长短不一) ...。

回答 1 投票 0

如何通过SnowSQL从Snowflake中存储的复杂json中提取数据?

我有几百万个JSON存储在Snowflake的一个单变列表中。它们的格式如下,虽然每个JSON的行数不同。请谁能给我一些指导......。

回答 1 投票 0

使用Python PyPDF2从扫描的pdf(图像)中提取文本[已关闭]。

我一直试图从扫描的PDF中提取文本(具有不可选择文本的图像)。但是,我得到的输出,这是不是一个人可读。我想要包含日期、......等信息。

回答 1 投票 0

从OBD2数据看发动机制动

所以我有这个数据帧从OBD2:时间发动机转速[RPM]车辆速度传感器[kmh]空气流量从质量流量传感器[Gs]PKE燃料流fuelcons 0 2020-06-01 ...。

回答 1 投票 0

由汽车速度产生正动能(PKE)

我有一个数据框,有3列,时间(每秒钟),每秒钟的速度(KMH),从这个数据框中我想计算正动能。这个公式我在这个研究中发现:https:...

回答 1 投票 -3

用python提取网址链接

我想在这个网页中提取所有的soocer事件的url链接:https:/www.coteur.comcotes-foot.php 当我使用xpath逐一尝试一场比赛时,它是确定的,你可以在我的下面的代码中看到它......

回答 1 投票 1

如何从SQL查询中的CREATEUPDATEINSERT语句中提取表名?

我正试图从存储在表列中的以下sql查询中解析正在创建、插入或更新的表。让我们调用表列查询。以下是一些示例数据...

回答 2 投票 -3

© www.soinside.com 2019 - 2024. All rights reserved.