我收到了来自 Html Agility Pack 的字符串 - 它已清理且没有标签:
string cleanText = htmlDoc.DocumentNode.InnerText;
现在我的问题是:如何清除所有空白字符,例如换行符等..?
示例字符串:
@Vanni
breitbart.com
#swiat
#usa
#youtube
#technologia
+2 inne
Akcja "They can't silence us" ma związek z pozwem wytoczonym przeciwko YouTube przez kanał PragerU za bezpodstawne zablokowanie konta.
我需要一个像这样的字符串:
@Vannibreitbart.com#swiat#usa#youtube#technologia+2inneAkcja“他们不能沉默”mazwiązekzpozwemwytoczonymprzeciwkoYouTubeprzezkanałPragerUzabezpodstawnezablokowaniekonta。
正则表达式可能很简单:
string compressed = Regex.Replace(bigstring, @"\s+", "");
您也可以将其作为字符数组进行迭代,并仅将 Char.IsWhitespace() 返回 false 的那些字符加载到字符串生成器中
用它来删除字符,将字符放在数组上以删除。将字符串传递给方法。这是静态方法
public static string RemoveCharSpecials(string document)
{
var charsToRemove = new string[] { "@", ",", ".", ";", "'", "(", ")", "-", " ", "/" };
try
{
if (!string.IsNullOrEmpty(document))
{
foreach (var c in charsToRemove)
document = document.Replace(c, string.Empty);
}
return document;
}
catch
{
return "";
}
}