我在网上找到了像http://www.chinesetopinyin.com/那样将汉字转换为拼音(罗马字母)的地方。有谁知道如何做到这一点,或者有一个可以解析的数据库?
编辑:我正在使用C#,但实际上更喜欢数据库/平面文件。
使用Python可能的解决方案:
我认为Unicode数据库包含汉字的拼音罗马字母,但这些不包含在unicodedata
模块数据中。
但是,您可以使用一些外部库,例如cjklib,例如:
# coding: UTF-8
import cjklib
from cjklib.characterlookup import CharacterLookup
c = u'好'
cjk = CharacterLookup('T')
readings = cjk.getReadingForCharacter(c, 'Pinyin')
for r in readings:
print r
输出:
hāo
hǎo
hào
UPDATE
cjklib附带一个独立的cjknife
实用程序,它可以提供帮助。一些用法描述here
如果你使用java,你可以使用pinyin4j。
好的,首先我在这里使用我的问题来获取unicode:
Converting chinese character to Unicode
然后拿这样的文件来转换它:http://www.ic.unicamp.br/~stolfi/voynich/Notes/061/uc-to-py.tbl
是的,这很容易。请改用Google翻译。它总是同时显示中文字符和拼音......这是MS(或Bing)翻译的一大缺点。
大多数非中国人如果希望在“野外”(在中文环境中)有正确发音的机会,就需要拼音。
同样,解决方案很简单......请改用Google翻译!