text-extraction 相关问题

文本提取是从非结构化和/或半结构化机器可读文档(文本)中自动提取结构化信息的任务。

EXCEL VBA 拆分函数 - 指定所有符号和字母作为分隔符

我正在使用EXCEL VBA,我有大量这样的字符串: str = "aei jt098_374!6.90*9U35t9miK34=90^1-349j582ge&%$g2=045 un=n20#^9i1=n5g76]90 82n3]-568@2^68*)85f1=0947f]287j...

回答 2 投票 0

Google 表格脚本,用于将超链接引用的文本从一张纸复制到另一张纸中

我在工作表中有一行单元格,其中一些包含超链接。这些超链接引用同一工作表中包含文本的单元格/单元格范围。我想运行一个脚本来查看

回答 1 投票 0

从文本中获取以关键字数组之一开头的子字符串,并且子字符串不得包含第二个关键字

我想编写一些接受两个参数 $text 和 $keys 的函数。 Keys 表示带有键的数组。 在输出中,我们需要获取一个数组,其中的键将是传递给函数的键...

回答 2 投票 0

分析pdf文件的格式并提取文本和图像[关闭]

我需要从这本杂志中提取有文字和图像的“文章”。图像内容必须单独放置,文本提取(尽可能)并单独放置。 嗬...

回答 4 投票 0

从字符串中提取单个(无符号)整数

我想从包含数字和字母的字符串中提取数字,例如: “我的购物车:11 件商品” 我想提取数字 11.

回答 23 投票 0

通过第一个空格和连字符分割格式化时间范围表达式

我想把这个字符串分割成3个数组元素。 $string = 'MW 01:00 PM - 02:30 PM'; 输出: 数组[0] = 兆瓦 数组[1] = 01:00 PM 数组[2] = 下午 02:30 帮助我使用将提取的正则表达式

回答 4 投票 0

从文本中提取所有单词并删除特定不需要的单词

我想替换这个字符串: 这是我的商店,它的设计令人惊叹;它的创建者说它正在赔钱,他不想维持它 除 '(d...

回答 2 投票 0

从看起来像带有 1 个参数的函数调用的字符串中提取数字

我想从字符串中提取一个数字。该字符串看起来像这样: “visaObs(31124228);” 这是我的尝试。似乎没有得到任何匹配: preg_match('/visaObs((\d+));...

回答 5 投票 0

获取 HTML 中标签文本后面出现的数字

我正在使用 PHP 解析电子邮件,并希望获取特定字符串后面的数字。 例如,我想从如下字符串中获取数字 033: 帐号:033 帐号

回答 4 投票 0

取消某些元素的资格并从字符串数组中隔离尾随数字

我在 PHP 数组中有各种值,如下所示: $values = ["news_24", "news_81", "blog_56", "member_55", "news_27"]; 第一部分是...

回答 4 投票 0

获取两个字符之间的数字

我试图在如下字符串中找到两个下划线(_)之间的数字: 234534_45_92374 3433_9458_034857 zx_8458_047346daf 正则表达式是什么?

回答 2 投票 0

获取唯一字符串和下划线之间的数值

有人可以告诉我如何使用正则表达式从该字符串中获取“123”: .../groups/123_abc/... 我确定 /组/ 该字符串中是唯一的。

回答 3 投票 0

获取字符第一次出现前面的数字

我有这个: 15_some_text_or_numbers; 我想得到第一个下划线前面的内容。 第一个下划线后面总是有一个字母。 例子: 14_你好_世界 = 14 结果是

回答 4 投票 0

获取括号之间的所有子字符串

我想提取两个字符(括号)之间的所有字符串。 $string = "blah blah blah (blorp) blah blah (bloop) blah blah (bam)"; 期望的输出: ['布洛普','布洛普','砰'] 我不

回答 5 投票 0

RegEx 用于查找数据中字符串的最终出现位置

我一直在寻找类似的示例,但我无法让任何东西完全适合我的用例。 我有一个处理用户标题的数据块,包括

回答 1 投票 0

提取出现在一个数据集中但未出现在另一个数据集中的常见关键词

我有两个数据集: Dataset#1:包含 2670 万条用现代标准阿拉伯语编写的评论的数据集。 Dataset#2:包含 16K 条评论的数据集,用现代标准阿拉伯语和口语阿拉伯语编写。 我...

回答 1 投票 0

使用python从pdf中提取文本

我编写了一个脚本,用于提取两个标题“摘要”和“参考文献”之间的内容,但脚本运行时没有错误,但它不会使用提取的内容创建新的 pdf...

回答 1 投票 0

安装“qd”库时出错!我们如何读取或操作 LS Dyana 的密钥文件?

目标:我有 .Key 文件,用于预处理 LS Dyna 模拟的数据文件。我想从该 .Key 文件中提取位于特定部件 ID (PID) 下的特定节点号。 为了达到以上g...

回答 1 投票 0

如何使用OCR读取表单数据,然后将OCR读取的数据转换为结构化数据?

我对 ML 领域非常陌生。 我希望从客户填写的物理表格(地址变更表格)中读取数据,使用 OCR 读取此数据。 然后能够将数据转换为结构化 JSON ...

回答 1 投票 0

在 R 中修剪数据

我在R中有一个数据框,其中一列数据是这样的 “828/公里(2,140/平方英里)” “365/公里(950/平方英里)” “1,102/公里(2,850/平方英里)” “1,029/...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.