string-matching 相关问题

字符串匹配是在另一个字符串(“text”,“haystack”)中查找一个字符串(“pattern”,“needle”)的问题。

使用数组中的键搜索字符串并返回第一个符合条件的键的值

我有一个像这样的数组: $array = ['猫' => 0, '狗' => 1]; 我有一个像这样的字符串: $string = '我喜欢猫。'; 我想看看在字符串中是否找到了数组中的任何键;如果是这样,我...

回答 4 投票 0

Python中的高性能模糊字符串比较,使用Levenshtein或difflib

我正在进行临床消息标准化(拼写检查),其中我根据 900,000 字的医学词典检查每个给定的单词。我更关心时间复杂度/性能。 我想要...

回答 2 投票 0

两个数据帧之间文本字符串的不对称部分匹配

我有两个数据框: df1 基于调查回复,并包含一个非限制字段,供用户添加其在英国的位置(或拒绝这样做),格式如下(非真实数据): 姓名 洛...

回答 1 投票 0

分割文件名,只取一部分使用

我有一个 $value,例如 22214-HAV.jpg 或 22214 HAV.jpg(注意没有破折号) 我想运行一个快速函数来仅从文件名中提取数字。

回答 3 投票 0

字符串模式匹配问题

想象我们有一个长字符串,其中包含子字符串“cat”和“dog”以及其他随机字符,例如。 猫×狗 猫×猫×狗×狗×猫×狗×猫 这里'x'代表任何随机序列...

回答 1 投票 0

如何检测字符串内相同的部分?

我尝试将解码算法想要的问题分解为更小的问题。这是第一部分。 问题: 两个字符串:s1 和 s2 s1 的一部分与 s2 的一部分相同 空格是分隔符 如何

回答 4 投票 0

“用户友好”.net 兼容的正则表达式/文本匹配工具?

目前在我们的软件中,我们提供了一个钩子,我们可以调用客户端构建的 DLL 来解析我们正在处理的文档中的信息(DLL 接受一些文本(或文件)并返回一个 li...

回答 1 投票 0

如何匹配以逗号分隔的可变项目列表

我想把这样的东西变成这样 CS 240、CS 246、ECE 222,...(或多或少);仅限软件工程专业的学生 进入 (“CS 240”、“CS 246”、“ECE 222”、“ECE 220”) 在 Python 中,与

回答 3 投票 0

在 R 中拆分逗号和分号分隔的字符串

我正在尝试拆分包含两个条目的字符串,每个条目都有特定的格式: 类别(例如活动站点/区域),后跟: 术语(例如 His、Glu/核苷酸结合基序 A)

回答 2 投票 0

在 Javascript 中,当用户键入时突出显示设置单词,同时保持光标位置[关闭]

我正在尝试在网页上制作一个超级简单的编辑器,当用户输入文本时,它会自动突出显示大型猫科动物的名字。 该脚本的要点如下: 当用户嗨...

回答 1 投票 0

将电话号码匹配纳入现有基于字符串的姓名匹配功能

我有一个 Python 函数 match_strings,它旨在匹配来自两个不同数据源的名称。这是函数定义: Python def match_strings(strings1, strings2, ngram_n=2,

回答 1 投票 0

有没有一种方法可以根据每个值中出现的两个关键字或短语将字符串向量重新编码为具有这两个值的新向量?

正如我的问题所示,我想将字符串向量转换为每个字符串中出现的两个值之一的新向量。这是我拥有的一个非常简单的数据框的示例: 数据&...

回答 1 投票 0

基于多个标准的过滤范围

我正在尝试根据多个关键字过滤属性列表(例如“酷室内”、“露台/露台”)。这是一个基本的解释: 我要过滤的范围位于...

回答 1 投票 0

基于多个标准的过滤范围(Google 表格)

我正在尝试根据多个关键字过滤属性列表(例如“酷室内”、“露台/露台”)。这是一个基本的解释: 我要过滤的范围位于...

回答 1 投票 0

使用正则表达式查找具有相似性的文本

我识别了不同 PDF 文档中的文本列表。现在我需要使用正则表达式从每个文本中提取一些值。我的一些模式是这样的: 一些文字[ -]?(.+)[ ,-]+...

回答 1 投票 0

C语言的Aho-Corasick算法

我编写了一个带有转换表的 Aho-Corasick 算法,该算法在文本中搜索一组单词并使用 malloc() 显示出现次数,但我遇到了这个 e...

回答 1 投票 0

给定一组字符串单词,找到字符串相等或一个字符串以另一个字符串开头的对的数量?

我在做竞技编程时遇到了这个问题,我不太确定如何最佳地解决它。 给定一个字符串单词数组,找到字符串中的单词对的数量...

回答 1 投票 0

使用 page.searchc_for 在 pdf 中搜索匹配的单词

我有一个单词列表,我正在使用 python 中的 fitz 在 pdf 文档中搜索这些单词 该代码通常适用于大多数单词,除了“效率”之类的少数单词之外 我的代码如下...

回答 1 投票 0

如何在 Python 3 中使用户条目不区分大小写?

首先,我是Python新手,从来没有写过代码,所以请原谅! 我正在关注 FreeCodeCamp 的 Python 教程。我想知道如何使用户输入不区分大小写....

回答 1 投票 0

R 中是否有一种方法可以根据第 1 列中的字符串是否包含在第 2 列中的字符串中来连接两列?

我试图在不使用“模糊匹配”的情况下将几个凌乱的数据集连接在一起。 在核心数据集中(下面的示例 dataset1),我有简单的公司名称。在数据集中我会...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.