我有一个数据框,其中包含用于课堂课程的标题,其中包含特殊字符。我正在尝试查找和替换它们,但是它不起作用
示例坦克走动–圆形便携式洗手间
db$objectName[db$objectName == "Tank Walk Around – Round Portable Restroom Tanks"] <- "Tank Walk Around - Round Portable Restroom Tanks"
我也有其他带有这些特殊字符的课程标题,它们也都存在问题
` ’ “ „ ¢ € ®
假设您要保留所有字母数字字符,则可以使用以下代码。该代码使用正则表达式删除所有非字母数字。
str = "Tank Walk Around – Round Portable Restroom Tanks"
print(strsplit(gsub("[^[:alnum:] ]", "", str), " +")[[1]])
结果:
source('〜/ .active-rstudio-document')
[[1]“坦克”“步行”“周围”“┓圆形”“便携式”“休息室”“坦克”