用阿拉伯语输入这个单词:مرَّة
这可以用以下Unicode字符序列编写:
/*
U+0645 # ARABIC LETTER MEEM
U+0631 # ARABIC LETTER REH
U+0651 # ARABIC SHADDA
U+064e # ARABIC FATHA
U+0629 # ARABIC LETTER TEH MARBUTA
*/
console.log("\u0645\u0631\u0651\u064e\u0629")
或此序列(相同的字母,但是FATHA和SHADDA的顺序被交换):
/*
U+0645 # ARABIC LETTER MEEM
U+0631 # ARABIC LETTER REH
U+064e # ARABIC FATHA
U+0651 # ARABIC SHADDA
U+0629 # ARABIC LETTER TEH MARBUTA
*/
console.log("\u0645\u0631\u064e\u0651\u0629")
它们都呈现相同的效果。他们俩都被认为是正确的吗?一个被认为比另一个更可取吗?
我不确定一个人是否正确。但是,对我而言有趣的是,对Unicode进行归一化始终会导致将shadda放在第二位,因为归一化形式为NFC,NFKC,NFD,NFKD。