用于删除复杂 html 标签的正则表达式

问题描述 投票:0回答:3
c# .net regex html-parsing
3个回答
1
投票

实现此目标的更好且正确的方法是使用 HTML 解析器(如敏捷 HTML 包)来解析 HTML 并根据您的要求使用。使用 REGEX 解析 HTML 很困难,而且容易出错。

了解更多:http://www.mikesdotnetting.com/article/273/using-the-htmlagilitypack-to-parse-html-in-asp-net


1
投票

如上所述,请阅读以下链接,为什么正则表达式不适用于 HTML -> 不要对 HTML 使用正则表达式

正如评论中建议的那样,使用 C# HTML 解析器,例如CsQuery


0
投票

你可以试试这个:

:%s/<.\{-}[^ ]>

[^ ]>
确保匹配
>
之前没有任何空格。

© www.soinside.com 2019 - 2024. All rights reserved.