extraction 相关问题

数据提取是从(通常是非结构化的或结构不良的)数据源中检索数据以进行进一步数据处理或数据存储(数据迁移)的行为或过程。

有什么方法可以从应用程序中提取文本?

我想从应用程序中提取某些信息,比如Zoom。特别是,假设我输入了错误的密码,并得到了 "该密码不正确 "的信息;有没有一种 ...

回答 1 投票 -1

无法用scrapy提取完整的url @href。

我想从amazon.in的链接中提取产品的url链接是 - href="Parachute-Coconut-Oil-600-FreedpB081WSB91Cref=sr_1_49?dchild=1&fpw=pantry&fst=as%3Aoff&qid=1588693187&s=...。

回答 1 投票 0

awk数字提取长度

我无法从 file1 的第 3 列中提取数字,这里应该满足条件,即只提取下划线前或下划线后长度为 8 的数字。

回答 1 投票 0

awk数字提取长度

我无法从 file1 的第 3 列中提取数字,这里应该满足条件,即只提取下划线前或下划线后长度为 8 的数字。

回答 1 投票 0

ExtractToDirectory , 如何在一个zip文件夹中使用c#提取一个zip文件夹。

问题:我有这段代码,可以提取指定目录内的所有.zip文件夹。现在我的问题是,我的.zip文件中包含了另一个.zip文件。我的程序的输出是......

回答 1 投票 0

使用pypdf2从chrome的打印选项提取pdf文件中的文本。

试图使用python(v 3.8.2)模块pypdf2(v 1.26.0)从pdf文件中提取文本。除了特定的pdf文件(从chrome打印选项中生成的)之外,一切都很好,我把这些文件放在 ...

回答 1 投票 0

Python gzip-提取.csv.gz文件-内存错误

我试图编写脚本以从ftp服务器访问.csv.gz文件,并将内容写回到同一服务器上的.csv文件。只要文件小于...

回答 2 投票 1

Astropy Cutout2D,提高ValueError

我正在尝试使用Astropy的Cutout2D测试所介绍的过程。我的目标是使用RA和DEC为地面真实目录中的每个来源提取一个.png图像。 ...

回答 1 投票 1

谁能弄清楚如何从以下字符串中提取时间和日期?

[有人可以从此字符串“ R000000010207180203151000”中提取时间和日期吗?我已经尝试过,但是也许我错过了一些东西或看起来不对。另一个示例:“ R001215379601050203140000”

回答 1 投票 0

反正有没有使用aws cli复制csv中存在的文件列表的方法?

我在s3存储桶上有一个名为all-files的文件夹,其中包含35K个文件。我有一个CSV文件(errors.csv),其文件名为1K,此文件名是35K文件名的子集。我需要复制1k个文件(...

回答 1 投票 0

尝试从数据框中的名称列提取标题给我这个错误“ AttributeError:'str'对象没有属性'Name'”

正在处理来自Kaggle的《泰坦尼克号机器学习竞赛》数据。对于['age_tr_df','age_te_df']中的数据集:dataset ['Title'] = dataset.Name.str.extract(r'([A-Za-z] +)\。',expand = False)因此,在此...

回答 1 投票 -1

使用python提取html文件中的特定部分

[如何提取HTML文件示例的特定部分https://patents.google.com/patent/EP1208209A1/en?oq=medicalinal+chemistry到目前为止,我已经使用beautifulsoup获取了html的文本版本。 。

回答 2 投票 0

按行从7zip流中读取文本文件

我有7z文件,其中包含一个文本文件,但是该文本文件很大。我不想将其提取到文件夹中。我想打开流并从7z逐行读取文件,而没有任何...

回答 1 投票 0

R代码从JSON日志文件中提取字段的值

我有一个文件,其中包含来自日志收集的50,000条记录。我需要为每个记录拉出“ State”:&“ Code”:之后的值。我已经尝试过正则表达式,但无法正常工作。 ...

回答 1 投票 0

从整数值中减去1和数十[重复]

我认为数学在Java中有点棘手。可以说我的整数值为203,并且要提取0和3。对我来说,最简单的方法是使用Intat(1)和Intat(2)或...

回答 2 投票 0

如何从tiktok视频URL中获取视频ID

我正在使用两个函数来获取URL或视频播放1.提取带有水印的视频的tiktok公共功能getDetails(){$ url = $ this-> url; $ resp = $ this-> getContent($ url)...

回答 1 投票 1

如何将表情符号的Unicode转换为CLDR短名称

我正在使用python提取注释并显示它们。当我打印时看起来像这样。这真是令人心痛\ u2764 \ ufe0f

回答 1 投票 0

从r中的长刺中提取朋友的ID

我有一个包含数千行的数据框。数据框包含许多列,其中第三列在每个单元格中包含一个长字符串,如下所示。 > file_analysis $ parameters [1] [1] {“ friends_id”:[...

回答 1 投票 -1

使用Google Colab提取.7z文件

我有一个带有.7z前缀的文件,我正尝试用google colab提取文件的内容,我尝试了以下linux指令:!7z img_celeba.7z,但不幸的是,它给出了此错误...

回答 1 投票 0

无法使用Python的BeasutifulSoup4 /提取方法从某些网址中抓取标题

我有两个简单的python脚本,可从URL刮取标题,主图像,描述。一种使用提取,另一种使用BeautifulSoup4。两者都适用于大多数网址(例如http://nytimes.com)...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.