将拉丁语名称转译为西里尔字母的问题

问题描述 投票:0回答:1

简单地说,我有 2 个主要列“名字”、“姓氏”,用于存储名字和姓氏的数据,这些数据是拉丁文的。

我尝试根据音译类型使用不同的库,但它们不适用于诸如 BOLATKHANOV 之类的姓氏,它显示为“”БОЛАТКХАНОВ”(尽管 БОЛАТХАНОВ 应该出现)

另一个例子:** TSAI **,它给出的是“ТСАИ”(但结果应该是“ЦАЙ”。图书馆在某些情况下无法将“I”识别为“Y”)

有什么图书馆可以提供帮助或其他吗?

我将非常感谢您的回答!

python text nlp transliteration
1个回答
0
投票

您尝试过停用词吗?

import nltk
from nltk.corpus import stopwords

stops = set(stopwords.words('russian'))
print(stops)

另请参阅可用语言

© www.soinside.com 2019 - 2024. All rights reserved.