如何删除使用正则表达式字的一些特殊字符?

问题描述 投票:0回答:1

我在的话分裂文件。我能拆分为词,但在某些字有像“___”特殊字符。我想跳过特殊字符也ND分裂从特殊字符这个词。

包含这样的数据文件

Yahoo$$$Yahoo OK : ___GET
Gmail$$$Gmail Ok:___GET
google_data$$$Google.com.in___POST

使用((?!)[0-9A-ZA-Z \ S] \ W +)+给我

Yahoo
Yahoo OK
 ___GET
Gmail
Gmail Ok
GET
google_data
Google.com.in___POST

我不想说“_____”,并以下字符串:

Google.com.in___POST

一直到用两个词来划分,如:

Google.com.in
POST

谁能帮我这个 ?

regex
1个回答
1
投票

使用\w也将匹配下划线。纵观数据,例如,你想匹配字符a-z或数字,并在两者之间可以有一个空间,圆点或下划线。

相反分裂的,你可能匹配的值:

[0-9a-zA-Z]+(?:[._ ][0-9a-zA-Z]+)*

说明

  • [0-9a-zA-Z]+匹配数字或A-Z中较低或大写1+倍
  • (?:非caputuring组 [._ ]匹配一个。 _或空间 [0-9a-zA-Z]+匹配数字或A-Z中较低或大写1+倍
  • )*关闭在捕获组和重复0+倍

Regex demo

© www.soinside.com 2019 - 2024. All rights reserved.