为什么这些字符有一大堆重音符号? [已关闭]

问题描述 投票:0回答:2

你有没有注意到网页中的这个字符ฏ๎ํ?由 0x0EOF、0x0E4E 和 0x0E4D 生成。

我可以在这里找到一些信息:http://shapecatcher.com/unicode/info/3599

但是,实际上应该是三个字符拼在一起,为什么在网页中,看起来永远不会结束?

(KUbuntu 12.04 Chrome 版本 23)

enter image description here

html char
2个回答
6
投票

这是一个大量重音字符,您也可以使用拉丁字符来执行此操作,例如 â̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂ ̂̂̂̂̂ 是一个带有很多抑扬符的 a。

这是 â̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂̂在十六进制编辑器中的显示方式: enter image description here

所以你可以看到有很多

CC 82
,它们是COMBINING CIRCUMFLEX ACCENT,我们来分析一下:

  1. EF BB BF
    字节顺序标记(BOM)
  2. C3 A2
    拉丁文小写字母 A 带有 Circumflex
  3. CC 82
    组合抑扬音: ^(与预览字母混合)

现在让我们尝试一下我们自己的,我做到了:

EF BB BF C3 AB CC 88 CC 88 CC 88
...这是结果:ë̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈̈

enter image description here

  1. EF BB BF
    字节顺序标记(BOM)
  2. C3 AB
    带有分音符的拉丁文小写字母 E:ë
  3. CC 88
    结合分音法

这是渲染问题吗?

实际上,二进制句子告诉系统执行“无限字符”,它们实际上并不是无限的,它们有一个限制,但是当人们这样做时,他们只是为了好玩,并在字母中添加了很多重音符号,让人们相信这是无穷大,例如,这个 a 只有 2 个波浪号: ã̃ ,另一个有 3 个: ã̃̃,下一个有很多: ã̃̃̃̃̃̃̃̃̃̃̃̃̃,这与锐音组合: ã̃́̃́̃́̃́̃́̃́̃́̃́̃́̃́̃̃ ́̃́


-1
投票

这就是我的角色显示方式:

ฏ๎ํ

(OS X 10.8、Safari)

如果它的显示方式与您不同,但变音符号以某种奇怪的方式间隔开,则意味着您的系统无法正确处理这种复杂组合字符的显示。

© www.soinside.com 2019 - 2024. All rights reserved.