我正在尝试获取输入的韩语音节的每个字符的列表,例如:
example = '만들다'
但是当我尝试使用:
print([*example[-2]])
我明白了
['들']
当我试图获得类似的输出时:
['ㄷ', 'ㅡ', 'ㄹ']
另一种方法是使用
unicodedata.normalize()
将每个音节分解为其组成部分。 Unicode 标准化形式 D 将朝鲜文音节分解为其组成字母。
import unicodedata as ud
example = '만들다'
hangul = example[-2]
print(f"{hangul}: U+{ord(hangul):04X}")
# 들: U+B4E4
jamo = ud.normalize("NFD", example[-2])
cp = ' '.join(f"U+{ord(j):04X}" for j in jamo)
print(f"{jamo}: {cp}")
# 들: U+1103 U+1173 U+11AF
print(list(jamo))
['ᄃ', 'ᅳ', 'ᆯ']
您可以使用Jamo模块来做到这一点
from jamo import h2j, j2hcj
example = '만들다'
char = example[-2]
print([*j2hcj(h2j(char))])
jamo 库提供了一个简单的韩文分解接口。 您还可以阅读文档