我正在查看 Unicode GraphemeBreakProperty 规范,根据 Unicode 标准附件 #29 中指定的表,
Prepend
属性应包括带有 Indic_Syllabic_Category = Consonant_Preceding_Repha
或 Indic_Syllabic_Category = Consonant_Prefixed
或 Prepended_Concatenation_Mark = Yes
的所有代码点。该规范列出了代码点如下:
# ================================================
0600..0605 ; Prepend # Cf [6] ARABIC NUMBER SIGN..ARABIC NUMBER MARK ABOVE
06DD ; Prepend # Cf ARABIC END OF AYAH
070F ; Prepend # Cf SYRIAC ABBREVIATION MARK
08E2 ; Prepend # Cf ARABIC DISPUTED END OF AYAH
0D4E ; Prepend # Lo MALAYALAM LETTER DOT REPH
110BD ; Prepend # Cf KAITHI NUMBER SIGN
110CD ; Prepend # Cf KAITHI NUMBER SIGN ABOVE
111C2..111C3 ; Prepend # Lo [2] SHARADA SIGN JIHVAMULIYA..SHARADA SIGN UPADHMANIYA
1193F ; Prepend # Lo DIVES AKURU PREFIXED NASAL SIGN
11941 ; Prepend # Lo DIVES AKURU INITIAL RA
11A3A ; Prepend # Lo ZANABAZAR SQUARE CLUSTER-INITIAL LETTER RA
11A84..11A89 ; Prepend # Lo [6] SOYOMBO SIGN JIHVAMULIYA..SOYOMBO CLUSTER-INITIAL LETTER SA
11D46 ; Prepend # Lo MASARAM GONDI REPHA
# Total code points: 24
在 UnicodeSet Utility 上搜索具有这些属性的字符仅列出 22 个代码点。什么是
1193f
和 11941
?为什么它们包含在 Prepend
GraphemeBreakProperty 中?附件只是没有将它们列在表中吗?任何帮助弄清楚为什么表格和规格似乎不同的帮助都会很棒!
谢谢!
U+1193F 和 U+11941 是在 Unicode 13.0 中添加的。问题中的链接现在将它们包含在列表中。