我正在尝试匹配 PDF 文档中的节标题,少数情况下会失败

问题描述 投票:0回答:1

这是我必须匹配 PDF 文档中的节标题的正则表达式。

正则表达式 =

^\s*(\d+\.?\d*(?:\.\d+)*)\s{1,10}([A-Z][a-zA-Z]*)

它匹配 3.1 简介、3 电池等字符串,但不匹配 3.1 的字符串 介绍已存在。

我还想匹配 A1 简介、A1.1 字符串、B3 电池测试、I3.1 等案例,其中 A、B...Z 附加在数字标题之前。

您能否分享如何编写两个适用于这些情况的正则表达式。

用于检测 我尝试了一些东西,比如,

^\s*(\d+\.?\d*(?:\.\d+)*)\n?\s{1,10}([A-Z][a-zA-Z]*)
- 但这不起作用。

python regex
1个回答
0
投票
\w?\d\.?\d?.*\n

\w?这匹配一个可选字符

\d 随后是 didget

。?可选点

\d?点后可选的提示

.* 一切直到换行

© www.soinside.com 2019 - 2024. All rights reserved.