编写一个正则表达式，为 $ 分隔符和 html 标签之外的每个单词添加一个范围

Question

我想使用正则表达式来执行以下操作：

我正在努力组合这 4 个，因为没有“and”和“not”运算符。

我试过了 (?=([A-Za-z0-9.]+))(?=<.?>(.?)<.*?>) for 但它不起作用，我不知道如何应用“不“至第 2 项和第 3 项。

Answer 1

这个问题可能不太适合正则表达式。如果你确实设法让它工作，那么将来人们阅读和理解正则表达式可能会很复杂并且相当困难。

此外，使用正则表达式来处理相对复杂的语法很容易错过边缘情况。

例如，您最初的方法可能会错过这样的事情：

<body>
  <p>Let's all do a thing.</p>
  $something$
  <p>All of us who are < 4 feet tall or > 6 feet tall should.</p>
</body>

您可以考虑使用 HTML 解析库，然后对每个 HTML 节点的内容使用 MathJax 解析库。然后用一个跨度包围 MathJax 未处理的每个事物。