通过正则表达式仅保留 HTML 标记之外

Question

我有一个如下列表：

  <td class="News"><a href="ubuntu">Ubuntu</a></td>
  <td class="News" style="text-align: right" title="Yesterday: 2578">2571<img src="/web/20061130064026im_/http://distrowatch.com/images/other/adown.png" alt="<" title="Yesterday: 2578"></td>
  <td class="News"><a href="suse">openSUSE</a></td>
  <td class="News" style="text-align: right" title="Yesterday: 1943">1943<img src="/web/20061130064026im_/http://distrowatch.com/images/other/alevel.png" alt="=" title="Yesterday: 1943"></td>
  <td class="News"><a href="fedora">Fedora</a></td>
  <td class="News" style="text-align: right" title="Yesterday: 1420">1422<img src="/web/20061130064026im_/http://distrowatch.com/images/other/aup.png" alt=">" title="Yesterday: 1420"></td>
  <td class="News"><a href="mepis">MEPIS</a></td>

现在我只想保留 HTML 标签之外的内容或记事本++中的

>*****<

例如，在上面的列表中，只有以下内容必须保留，其他内容必须删除：

Ubuntu
2571
openSUSE
1943
Fedora
1422
MEPIS

我尝试了以下正则表达式，但它不准确并且还保留了额外的代码：

>([^<>]+)<

我的正则表达式问题出在哪里？

Answer 1

获得示例中提到的结果。

查找内容： (?:<[\s\w="-:]+>\s*)+(\w+).+

替换为： $1

使用此屏幕中所示的选项。

通过正则表达式仅保留 HTML 标记之外

问题描述投票：0回答：1

1个回答

最新问题

通过正则表达式仅保留 HTML 标记之外

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1