regex 相关问题

正则表达式提供了一种声明性语言来匹配字符串中的模式。它们通常用于字符串验证,解析和转换。由于正则表达式未完全标准化,因此具有此标记的所有问题还应包含指定适用的编程语言或工具的标记。注意:要求HTML,JSON等正则表达式往往会遇到负面反应。如果有解析器,请使用它。

如何修改这个正则表达式模式?

我想查找以“access”和数字结尾的日志文件,例如 500m-access0.log。 我的代码: bool is_access_log(const char *文件名) { std::字符串名称(文件名); 结构统计

回答 1 投票 0

尝试用替代字符串替换 sed 匹配模式的一部分

我正在尝试将我的个人科幻小说图书 PDF 库转换为 epub。我将所有行收集到连续段落中的中间步骤正确整理,但我最终......

回答 2 投票 0

使用 itertools 出现第 n 个子字符串

我正在尝试编写一个函数,该函数返回一个字符串,其中第 n 个子字符串被新的子字符串替换: 我尝试了以下方法: 进口重新 从 itertools 导入计数 文本=“

回答 2 投票 0

根据完整关键词突出显示搜索关键词的文字

我需要突出显示博客中用于搜索的关键字。到目前为止,我设法使用以下脚本http://www.jquery.info/scripts/SearchHighlight/demo_en.html 但这个脚本不匹配...

回答 2 投票 0

从包含基本数据描述的文本字段中识别和检索特定的字符序列

我有一个名为 MAT_DESC 的列表,其中包含自由文本格式的材料描述。以下是 MAT_DESC 列中的一些示例值: QWERTYUI PN-DR,粗粒,TR,1-1/2 英寸,50 个/箱,200 个...

回答 1 投票 0

查找多个特定长度的子字符串(查找字符串中的5位和6位数字)

我有一个这样的 => list_o_text= [ '随机字符串 1 2 3 45 6789 999999 22222', '技术报告示例 444444' ] list_o_text 中的每个字符串肯定包含一个或多个 5 或 6 位数字

回答 2 投票 0

用于手机号码验证的正则表达式

我想要一个用于手机号码验证的正则表达式。正则表达式模式应该是这样的:它必须仅在开头接受+,并且仅在国家/地区代码之后才允许空格(或-)(仅一次)。只有 10 个...

回答 4 投票 0

RegEx 用于匹配逗号前面的单词,但有例外

我要定位的文本部分始终以“Also There is”开头,并以句点结尾。逗号之间的单个名称是我想要定位的目标(即

回答 3 投票 0

如果字符串以另一个单词 regex perl 开头,则忽略该字符串

我正在阅读一个 XML 文件,其中我正在替换某些单词。我不想替换 XML 元素或属性中的单词。我使用消极的向后看和向前看,我已经完成了 90%。

回答 1 投票 0

仅在 Perl 正则表达式中匹配最后一次出现的位置

/1.1/s/1/-/g 我正在做学校作业以参考实现 sed 命令。我得到这个字符串来匹配“/1/-/”。我有实验 $str =~ m{/[^/]*/[^/]*/}g; 但结果是/1...

回答 2 投票 0

使用正则表达式从字符串(不同格式)中提取 int 值

我的 Pandas 数据集中有一个字符串值(足球得分)。我想从这个比分中提取主场进球和客场进球。 分数可以用几种方式写(有时是......

回答 1 投票 0

python 正则表达式在模式匹配后捕获直到结束

我有一个输出,其中有一些听众和一些值。我想捕获标题之后的所有内容。我尝试编写一个模式来匹配标题并删除其后的行....

回答 1 投票 0

在 Python Polars 中捕获 f 字符串中的组

我正在尝试转换这样的系列 s = pl.Series(['{1-5}', '1']) 像这样的系列 pl.Series(['{1, 2, 3, 4, 5}', '1']) 如果我手动写入对应于

回答 1 投票 0

正则表达式中的非分组

所以我知道 [^A-Za-z] 将匹配任何非字母的字符。 有什么办法可以在团体中做到这一点吗?例如: (?^:&) - 将匹配任何字符序列...

回答 3 投票 0

正则表达式替换分隔列表中的特定单词/短语

我正在尝试让 Java 正则表达式替换逗号分隔列表中的特定短语。它还应该匹配/替换前导逗号以及任何前导/尾随空格。我必须严格使用

回答 1 投票 0

正则表达式负前瞻为真,然后忽略正则表达式的其余部分

我正在使用以下 IIS 重写规则来阻止尽可能多的机器人。 我正在使用以下 IIS 重写规则来阻止尽可能多的机器人。 <rule name="BotBlock" stopProcessing="true"> <match url=".*" /> <conditions> <add input="{HTTP_USER_AGENT}" pattern="^$|\b(?!.*googlebot.*\b)\w*(?:bot|crawl|spider)\w*" /> </conditions> <action type="CustomResponse" statusCode="403" statusReason="Forbidden" statusDescription="Forbidden" /> </rule> 目标是阻止所有带有部件机器人、爬虫或蜘蛛的用户代理,但允许 Google 机器人。这在一定程度上有效。但问题是,即使在字符串中找到“googlebot”,正则表达式的第二部分也会被触发。 下面一些例子的含义: Googlebot/2.1 (+http://www.google.com) 工作正常,googlebot 中的“bot”部分被忽略并且请求被允许。 Googlebot/2.1 (+http://www.google.com/bot.html) 不起作用,仍然在字符串中的第二个“机器人”上触发,并且请求被阻止 KHTML, like Gecko; compatible; bingbot 工作正常,在 bingbot 中的机器人上触发并且请求被阻止 那么有人可以帮我更改 rexeg 以便允许带有 Googlebot/2.1 (+http://www.google.com/bot.html) 的字符串吗? 我不熟悉 IIS 的确切正则表达式风格,但是如果您可以启用不区分大小写的正则表达式,则此 应该 可以工作: ^(?!.*googlebot)(?=.*(?:bot|crawl|spider)).* 说明: ^ - 起始线锚点 (?!.*googlebot) - 在我之前,“googlebot”这个词不存在 (?=.*(?:bot|crawl|spider)) - 在我面前,存在“机器人”、“爬行”或“蜘蛛”这个词 .* - 捕获整行(在 IIS 规则的上下文中可能没有必要) 负前瞻和正前瞻的组合会在正则表达式中产生隐式 and 条件;两者都必须为 true 才能使正则表达式注册匹配。 https://regex101.com/r/MFKKyU/1

回答 1 投票 0

Regext 来查找和删除歌词

我有一个工作流程,可以将字幕与视频分开,然后从文件中删除听力障碍者和其他无关材料。我只想要说话的部分。 歌曲的歌词是

回答 1 投票 0

使用正则表达式进行字符串求反

正则表达式中可以进行字符串求反吗?我需要匹配所有不包含字符串“..”的字符串。我知道你可以使用 ^[^\.]*$ 来匹配所有不包含 ... 的字符串

回答 3 投票 0

解析许多小字符串或单个大字符串 - 哪个更快?

在需要用正则表达式解析大量字符串的场景下,考虑到所有测试都会使用同一个RegEx针,这样会更快: 测试

回答 2 投票 0

无法在 C 中使用 PCRE 正则表达式匹配整个字符串

这个正则表达式 '(?:[sdmt]|ll|ve|re)| ?\p{L}+| ?\p{N}+| ?[^\s\p{L}\p{N}]+|\s+(?!\S)|\s+ 按预期工作以匹配 Ġmeousrtr,这可以在共享链接 https://regex101 中看到。 com/r/UR0P...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.