在Python中查找单词中的所有韩语字符

问题描述 投票:0回答:3

我正在尝试获取输入的韩语音节的每个字符的列表,例如:

example = '만들다'

但是当我尝试使用:

print([*example[-2]])

我明白了

['들']

当我试图获得类似的输出时:

['ㄷ', 'ㅡ', 'ㄹ']
python arrays string cjk
3个回答
1
投票

另一种方法是使用

unicodedata.normalize()
将每个音节分解为其组成部分。 Unicode 标准化形式 D 将朝鲜文音节分解为其组成字母。

import unicodedata as ud
example = '만들다'
hangul = example[-2]
print(f"{hangul}: U+{ord(hangul):04X}")
# 들: U+B4E4
jamo = ud.normalize("NFD", example[-2])
cp = ' '.join(f"U+{ord(j):04X}" for j in jamo)
print(f"{jamo}: {cp}")
# 들: U+1103 U+1173 U+11AF
print(list(jamo))
['ᄃ', 'ᅳ', 'ᆯ']

0
投票

您可以使用Jamo模块来做到这一点

from jamo import h2j, j2hcj
example = '만들다'
char = example[-2]
print([*j2hcj(h2j(char))])

jamo 库提供了一个简单的韩文分解接口。 您还可以阅读文档


0
投票

获取从

[*example[-2]]
获得的“들”并将其分解为其组件 - 请参阅此问题/答案中的我的 Python 代码。拨打
HangulName()
,您就会收到信件。

© www.soinside.com 2019 - 2024. All rights reserved.