在R中,是否可以使用Unicode字符'
ZERO WIDTH SPACE
'(U+200B
)?
当它被包含到字符串中时,它不会得到输出:
> "x\u00B1y"
[1] "x±y"
> "x\u200By"
[1] "xy"
我一直在寻找支持 Unicode 字符 '
ZERO WIDTH SPACE
' (U+200B
) 的软件包,但我没有找到。
来自维基百科:
零宽度空格 (),缩写为 ZWSP,是一种非打印字符,用于计算机排版中,用于在不使用显式空格或字符之后的脚本中向文本处理系统指示单词边界(例如斜线),后面没有可见的空格,但后面可能有换行符。 [强调我的]
换句话说,它在那里,但没有打印。
我测试了基本的 R 函数以及 tidyverse 函数,它们似乎都支持它。您可以以微妙或不那么微妙的方式看到它在字符串中的存在:
s <- "x\u200By"
nchar(s) # [1] 3
substr(s, 2, 2) # [1] ""
stringi::stri_escape_unicode(substr(s, 2, 2)) # [1] "\\u200b"