这是我必须匹配 PDF 文档中的节标题的正则表达式。
正则表达式 =
^\s*(\d+\.?\d*(?:\.\d+)*)\s{1,10}([A-Z][a-zA-Z]*)
它匹配 3.1 简介、3 电池等字符串,但不匹配 3.1 的字符串 介绍已存在。
我还想匹配 A1 简介、A1.1 字符串、B3 电池测试、I3.1 等案例,其中 A、B...Z 附加在数字标题之前。
您能否分享如何编写两个适用于这些情况的正则表达式。
用于检测 我尝试了一些东西,比如,
^\s*(\d+\.?\d*(?:\.\d+)*)\n?\s{1,10}([A-Z][a-zA-Z]*)
- 但这不起作用。
\w?\d\.?\d?.*\n
\w?这匹配一个可选字符
\d 随后是 didget
。?可选点
\d?点后可选的提示
.* 一切直到换行