extract 相关问题

与从(通常是最低结构化的)数据源检索特定信息有关的问题,例如网站,媒体文件,源代码集合或压缩存档(在这种情况下,所需信息是一个或多个原始的未压缩文件)。使用此标记时,请添加其他标记以阐明您的问题所涉及的特定环境/语言/方案。

从 python 中的文件夹中仅提取某些文件作为列表

我的文件夹中有以下文件列表: 数据.txt an_123.txt 信息日志 an_234.txt 文件名.txt 主要.py an_55.txt 我只想提取前缀为 as 列表的 .txt 文件。

回答 2 投票 0

使用 hive sql 函数从单个单元格中提取单个字符串

我有一个单元格,其中包含多个以逗号分隔的字符串值。我只需要提取一个字符串。 例子: 单元格值:[{id=111,title=Arun.P,jobTitle=数据分析师}] 预期结果:

回答 1 投票 0

我想从具有两种类型的类的html页面中提取文本

我想从html页面中提取运费。但我需要从两种类型的 html 页面中提取运费。 对于一页,Xpath 是 //*[@class="flex flex-row ju...

回答 1 投票 0

如何在Mac上从*.jar文件中提取源代码?

我很困惑。我下载了一个 *.jar 文件作为一个软件。所以我想把源码提取出来看看 我使用命令 jar xf filename.jar 返回了另外两个 *.jar f...

回答 5 投票 0

如何在Python中提取<h1></h1>之间的文本?

我被困在提取 和 之间的文本。 请帮我。 我的代码是: 导入bs4 进口重新 导入 urllib2 url2='http://www.flipkart.com/mobiles/pr?sid=tyy,4io&otracker=

回答 2 投票 0

如何在R中提取具有多个可以更改的单词的字符串后的somo字符

我想提取几个字符(在本例中为数字),它们位于可以改变长度的字母字符串之后(例如,在 1 和 3 之间)。例如: 动物<-c('B...

回答 1 投票 0

我需要使用Xpath提取alt元素

在此输入图像描述 我正在使用这个xpath //*[@class="相对mr3"]//div[2]//img/alt/text() 提取 “Tramontina Primaware 18 件套不粘炊具套装,钢灰色&qu...

回答 2 投票 0

vtk 脚本 - 沿线提取数据

我想保存 CFD 计算的数据。我需要使用 vtk 脚本在 .csv 文件中沿线提取数据。这是我想做的: 画一条线 保存数量的值...

回答 1 投票 0

Paraview 的 vtk 脚本 - 沿线提取数据

我想使用 vtk 脚本将 Paraview 中的数据沿着一条线保存在 .csv 文件中。这是我想做的: 画一条线 保存感兴趣数量的值(第一个

回答 1 投票 0

如何在KQL中解析

需要在KQL中解析这些信息 {"firmware_manufacturer":"思科","firmware_device_type":["交换机"],"firmware_model":"WS-C2960CX-8PC-L&qu...

回答 1 投票 0

如何使用BeautifulSoup从网站提取内容?

我必须从该网站文本中提取文章内容 从 bs4 导入 BeautifulSoup 导入请求 将 pandas 导入为 pd url = 'https://economictimes.indiatimes.com/industry/cons-products/food...

回答 1 投票 0

使用批处理命令从文本文件中获取特定字符串[关闭]

我正在寻找一个Windows批处理脚本命令,可以从自动生成的文本文件中提取特定的数据字符串。请注意,test.txt 文件中的第一行始终为空。我需要...

回答 1 投票 0

C++:PDF解析-->提取文本-->podofo-0.10.3

我已经在 Visual Studio 2022 中成功编译了 PoDoFo 0.10.3。 现在我想使用这个库从 PDF 文档中提取文本,但我在 API 上遇到了困难。 即使我找不到任何考试...

回答 1 投票 0

推荐提取api/库,以便更好地使用Nodejs提取pdf中的所有信息

在 Nodejs 中,哪个库或 api 最适合提取 pdf 文件中的信息。 像文本(它们如何正确地构造)、图像(加上图像上的信息,比如文本,如果它去的话......

回答 1 投票 0

如何解决 pyodbc 中的[错误]错误:('HY000','驱动程序未提供错误!')

我正在致力于通过 DataDirect 混合数据管道 ODBC 驱动程序从外部基于云的源中提取数据。实际的提取是通过 AWS Lambda 函数运行的,该函数通过以下方式调用:

回答 1 投票 0

7zip 命令行提取不包括文件名中带有空格的单个文件

在 Windows 11 上从命令行使用 7z.exe (v19.00 x64) 我已经尝试过这些语法: "C:\Program Files -Zip z" x -bb3 -x"Www.WebAddress.Net - 我的网站.url" -o_Extracted -

回答 1 投票 0

如何使用 bs4 在 HTML 中查找包含 : 且不包含 = 的数据

嗨,我目前在使用 bs4 和正则表达式查找 html 中的信息时遇到问题,因为它们包含在 : 中,而不是像我习惯的 = 中。 您好,我目前在使用 bs4 和正则表达式在 html 中查找信息时遇到问题,因为它们包含在 : 中,而不是像我习惯的 = 中。 <div data-react-cache-id="ListItemSale-0" data-react-class="ListItemSale" data-react-props='{"imageUrl":"https://laced.imgix.net/products/aa0ff81c-ec3b-4275-82b3-549c819d1404.jpg?w=196","title":{"label":"Air Jordan 1 Mid Madder Root GS","href":"/products/air-jordan-1-mid-madder-root-gs"},"contentCount":3,"info":"UK 4.5 | EU 37.5 | US 5","subInfo":"DM9077-108","hasStatus":true,"isBuyer":false,"status":"pending_shipment","statusOverride":null,"statusMessage":"Pending","statusMods":["red"],"price":"£125","priceAction":null,"subPrice":null,"actions":[{"label":"View","href":"/account/selling/M2RO1DNV"},{"label":"Re-Print Postage","href":"/account/selling/M2RO1DNV/shipping-label","options":{"disabled":false}},{"label":"View Postage","href":"/account/selling/M2RO1DNV/shipping-label.pdf","options":{"target":"_blank","disabled":false}}]}'></div> 我正在尝试提取中的href链接 {"label":"Re-Print Postage","href":"/account/selling/M2RO1DNV/shipping-label" 我该怎么做?我尝试过正则表达式、find_all 但无济于事。谢谢 我的代码如下供参考,我将#放在我尝试过的解决方案旁边 account_soup = bs(my_account.text, 'lxml') links = account_soup.find_all('div', {'data-react-class': 'ListItemSale'}) #for links in download_link['actions']: #print(links['href']) #for i in links: #link_main = i.find('title') #link = re.findall('^/account*shipping-label$', link_main) #print(link) 您需要获取每个 data-react-props 的 div 属性,然后将其解析为 JSON。然后,您可以迭代 actions 属性并获取与您的描述匹配的 href 属性: actions = [] for l in links: props = json.loads(l['data-react-props']) for a in props['actions']: m = re.match(r'^/account.*shipping-label$', a['href']) if m is not None: actions.append(m[0]) print(actions) 样本数据的输出: ['/account/selling/M2RO1DNV/shipping-label']

回答 1 投票 0

从网页中提取隐藏链接

请检查此链接 https://maroof.sa/businesses。 这是我想从中提取链接的网站的链接。 例如,如果您向下滚动,您会找到商店名称“Marwa store&qu...

回答 1 投票 0

如何从pdf中提取元素

我有一个项目,要求我使用Python从一堆pdf文件中提取内容,包括文本、图像和表格,按照它们在原始文件中出现的顺序,我的专业人士...

回答 1 投票 0

如何从pdf文件中提取数据

我有一个包含许多表格的pdf文件。这是一个很长的文件(35页).. 我尝试通过excel导入表格,但没有成功。网上的一些工具也试过了,还是不行。有什么建议吗...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.