你有没有注意到网页中的这个字符ฏ๎ํ?由 0x0EOF、0x0E4E 和 0x0E4D 生成。
我可以在这里找到一些信息:http://shapecatcher.com/unicode/info/3599。
但是,实际上应该是三个字符拼在一起,为什么在网页中,看起来永远不会结束?
(KUbuntu 12.04 Chrome 版本 23)
这是一个大量重音字符,您也可以使用拉丁字符来执行此操作,例如 â̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂ ̂̂̂̂̂ 是一个带有很多抑扬符的 a。
这是 â̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂在十六进制编辑器中的显示方式:
所以你可以看到有很多
CC 82
,它们是COMBINING CIRCUMFLEX ACCENT,我们来分析一下:
EF BB BF
:字节顺序标记(BOM)C3 A2
:拉丁文小写字母
A 带有 Circumflex: CC 82
:组合抑扬音:
^(与预览字母混合)现在让我们尝试一下我们自己的,我做到了:
EF BB BF C3 AB CC 88 CC 88 CC 88
...这是结果:ë̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈
EF BB BF
:字节顺序标记(BOM)C3 AB
:带有分音符的拉丁文小写字母 E:ëCC 88
:结合分音法:实际上,二进制句子告诉系统执行“无限字符”,它们实际上并不是无限的,它们有一个限制,但是当人们这样做时,他们只是为了好玩,并在字母中添加了很多重音符号,让人们相信这是无穷大,例如,这个 a 只有 2 个波浪号: ã̃ ,另一个有 3 个: ã̃̃,下一个有很多: ã̃̃̃̃̃̃̃̃̃̃̃̃̃,这与锐音组合: ã̃́̃́̃́̃́̃́̃́̃́̃́̃́̃́̃̃ ́̃́
这就是我的角色显示方式:
(OS X 10.8、Safari)
如果它的显示方式与您不同,但变音符号以某种奇怪的方式间隔开,则意味着您的系统无法正确处理这种复杂组合字符的显示。