我在的话分裂文件。我能拆分为词,但在某些字有像“___”特殊字符。我想跳过特殊字符也ND分裂从特殊字符这个词。
包含这样的数据文件
Yahoo$$$Yahoo OK : ___GET
Gmail$$$Gmail Ok:___GET
google_data$$$Google.com.in___POST
使用((?!)[0-9A-ZA-Z \ S] \ W +)+给我
Yahoo
Yahoo OK
___GET
Gmail
Gmail Ok
GET
google_data
Google.com.in___POST
我不想说“_____”,并以下字符串:
Google.com.in___POST
一直到用两个词来划分,如:
Google.com.in
POST
谁能帮我这个 ?
使用\w
也将匹配下划线。纵观数据,例如,你想匹配字符a-z或数字,并在两者之间可以有一个空间,圆点或下划线。
相反分裂的,你可能匹配的值:
[0-9a-zA-Z]+(?:[._ ][0-9a-zA-Z]+)*
说明
[0-9a-zA-Z]+
匹配数字或A-Z中较低或大写1+倍(?:
非caputuring组
[._ ]
匹配一个。 _或空间
[0-9a-zA-Z]+
匹配数字或A-Z中较低或大写1+倍)*
关闭在捕获组和重复0+倍