将中文转换为拼音

问题描述 投票:5回答:4

我在网上找到了像http://www.chinesetopinyin.com/那样将汉字转换为拼音(罗马字母)的地方。有谁知道如何做到这一点,或者有一个可以解析的数据库?

编辑:我正在使用C#,但实际上更喜欢数据库/平面文件。

parsing cjk
4个回答
6
投票

使用Python可能的解决方案:

我认为Unicode数据库包含汉字的拼音罗马字母,但这些不包含在unicodedata模块数据中。

但是,您可以使用一些外部库,例如cjklib,例如:

# coding: UTF-8
import cjklib
from cjklib.characterlookup import CharacterLookup

c = u'好'

cjk = CharacterLookup('T')
readings = cjk.getReadingForCharacter(c, 'Pinyin')
for r in readings:
    print r

输出:

hāo
hǎo
hào

UPDATE

cjklib附带一个独立的cjknife实用程序,它可以提供帮助。一些用法描述here


3
投票

如果你使用java,你可以使用pinyin4j。

http://pinyin4j.sourceforge.net/


0
投票

好的,首先我在这里使用我的问题来获取unicode:

Converting chinese character to Unicode

然后拿这样的文件来转换它:http://www.ic.unicamp.br/~stolfi/voynich/Notes/061/uc-to-py.tbl


-2
投票

是的,这很容易。请改用Google翻译。它总是同时显示中文字符和拼音......这是MS(或Bing)翻译的一大缺点。

大多数非中国人如果希望在“野外”(在中文环境中)有正确发音的机会,就需要拼音。

同样,解决方案很简单......请改用Google翻译!

© www.soinside.com 2019 - 2024. All rights reserved.