我需要阅读一个HTML
文件,并确认使用HTML
正确关闭所有Stack
标签。我现在正在阅读文件并找到每个标签时遇到麻烦。我不知道该怎么办。我应该阅读文件的每一行,使用正则表达式查找标签,然后添加到堆栈......或者有更好的方法吗?
您尝试使用的每个手工制作的解决方案都将成为一场噩梦。我真的建议你使用一个可以正确处理HTML
的外部库。随着HTML Agility Pack这个任务成了一个笑话:
// your string variable containing HTML
String html = ...
HtmlDocument document = new HtmlDocument();
document.LoadHtml(html);
foreach (HtmlParseError error in document.ParseErrors)
{
Console.WriteLine("ERROR: " + error.Code.ToString());
Console.WriteLine(error.Reason);
Console.WriteLine();
}