C#Regex.Split的工作方式与JavaScript不同

问题描述 投票:9回答:2

我正在尝试将this long JS regex转换为C#。

下面的JS代码给出了从["","常","","に","","最新","、","最高"...]开始的数组中的29个项目

var keywords = /(\ |[a-zA-Z0-9]+\.[a-z]{2,}|[一-龠々〆ヵヶゝ]+|[ぁ-んゝ]+|[ァ-ヴー]+|[a-zA-Z0-9]+|[a-zA-Z0-9]+)/g;
var source = '常に最新、最高のモバイル。Androidを開発した同じチームから。';
var result = source.split(keywords);

但下面的C#代码给出了string[]中的非拆分单项。

var keywords = @"/(\ |[a-zA-Z0-9]+\.[a-z]{2,}|[一-龠々〆ヵヶゝ]+|[ぁ-んゝ]+|[ァ-ヴー]+|[a-zA-Z0-9]+|[a-zA-Z0-9]+)/g";
var source = @"常に最新、最高のモバイル。Androidを開発した同じチームから。";
var result = Regex.Split(source, keywords);

Stack Overflow中的许多问题仅涵盖相对简单的表达式,因此我无法找到错误。

我错过了什么?

javascript c# regex cjk
2个回答
14
投票

您的RegEx错误,您不应该以'/''/g'开头和结尾您在构造函数中指定了一个字符串,而不是JavaScript Regex(带有'/ /'语法。)。这是一个Javascript语法。

实际上,当您使用这样的字符串构造函数时,同样适用于JavaScript:

var regex = new RegExp('//'); //这将匹配2个斜杠


1
投票

这是一个C#示例代码

string keywords = @"(\ |[a-zA-Z0-9]+\.[a-z]{2,}|[一-龠々〆ヵヶゝ]+|[ぁ-んゝ]+|[ァ-ヴー]+|[a-zA-Z0-9]+|[a-zA-Z0-9]+)";
string source = @"常に最新、最高のモバイル。Androidを開発した同じチームから。";
string [] res = Regex.Split(source, keywords);

string single = "";
foreach ( string str in res )
    single += "'" + str + "',";
Console.WriteLine("{0}", single);
© www.soinside.com 2019 - 2024. All rights reserved.