我已经看到了这个答案:How to get parentheses inside parentheses,但是如果我不知道这些括号的级别数,它就不会真正起作用。
我实际上是在尝试使用python对js文件进行模糊处理,而我有这种类型的字符串我想“废弃”:
String.fromCharCode
(
(010 * 12 + 6),
(06 * (0x1 * (1 * 0xa + 6) + 1) + 12),
(4 * 27 + 3),
(01 * 0x3b + 50),
(1 * 0x34 + 15),
(1 * (1 * (3 * ((0x1 * 8 + 7) * 1 + 0) + 8) + 24) + 27),
(0x1 * (2 * 0x25 + 7) + 16),
(1 * 0112 + 40),
(1 * 0x2c + 23),
(0x3 * 042 + 9),
(1 * ((05 * 4 + 1) * 03 + 0) + 37),
(0x2 * (1 * 0x1f + 4) + 31)
)
当我运行时:re.findall(r"String.fromCharCode\((.+?)\)", content)
首先返回我String.fromCharCode((03 * (07 * 4 + 3)
。因此,似乎我的代码行仅在搜索闭合括号的首次出现。我没有尝试上面链接的答案,但似乎不是“无限”,我们应该事先知道级别的数量。
而且我想得到的是这样的整个括号:((010 * 12 + 6),(06 * (0x1 * (1 * 0xa + 6) + 1) + 12),(4 * 27 + 3),(01 * 0x3b + 50),(1 * 0x34 + 15),(1 * (1 * (3 * ((0x1 * 8 + 7) * 1 + 0) + 8) + 24) + 27),(0x1 * (2 * 0x25 + 7) + 16),(1 * 0112 + 40),(1 * 0x2c + 23),(0x3 * 042 + 9),(1 * ((05 * 4 + 1) * 03 + 0) + 37),(0x2 * (1 * 0x1f + 4) + 31))
python中的+
限定词默认情况下是贪婪的,因此它将尽可能匹配。您在其后添加了一个?
,这使其变得非贪婪。取出?
,它应该一直匹配到下一个右括号,但如果它可以在您的输入中找到更多的右括号,则它的匹配范围也将更大,即使它在fromCharCode
右括号之外。