是否有一些python工具或软件工具，通过它我可以访问字体内的所有组件和表？

Question

我的最终目标是创建从glyph_id到unicode_chars的映射。该映射将具有某种顺序glyph_id --> uni_1, uni_2, uni_3 ...，因为单个字形可以映射到许多有序的unicode_characters。

我正在寻找一些工具或库，最好是在python中，我可以通过它访问所有的元信息，如字体内的表格。

此外，我正在寻找一些可靠的来源，通过它我可以理解将多个Unicode映射到字形的过程。

我知道像harfbuzz这样的工具会在给定的Unicode字符串上生成（字形，位置）对。但我不确定它是否反过来。

所有的帮助将不胜感激谢谢。

Answer 1

您应该查看fontTools Python库，它包含使用字体所需的组件。

您感兴趣的字体表是'cmap'表，您想要的基本上是Unicode映射子表的反向映射（有几种子表可以映射Unicodes;如果您不熟悉这个概念，我建议查看OpenType specification了解更多信息）。基本上你得到Unicode到字形的映射，并反过来。

fontTools实际上有一个很好的功能，它将自动选择“最佳”cmap子表（它有一个首选cmap子表类型的有序列表，并返回你打开的特定字体中的第一个可用）。这是使用该函数的示例：

from fontTools.ttLib import TTFont
from collections import defaultdict

font = TTFont('path/to/fontfile.ttf')
unicode_map = font.getBestCmap()
reverse_unicode_map = defaultdict(list)

for k, v in unicode_map.items():
    reverse_unicode_map[v].append(k)

reverse_unicode_map现在拥有一个字形（字形名称）到整数代码点列表的映射：

>>> reverse_unicode_map
defaultdict(<class 'list'>, {'.null': [0, 8, 29], 'nonmarkingreturn': [9, 13], 'space': [32], 'exclam': [33], 'quotedbl': [34], 'numbersign': [35], 'dollar': [36], 'percent': [37], 'quotesingle': [39], 'parenleft': [40], 'parenright': [41], 'asterisk': [42], 'plus': [43], 'comma': [44], 'hyphen': [45], 'period': [46], 'slash': [47], 'zero': [48], 'one': [49], 'two': [50], 'three': [51], 'four': [52], 'five': [53]})

您可以看到有两个字形，“。null”和“nonmarkingreturn”映射到多个Unicode。

如果需要将字形名称解析为字形索引，可以使用font.getGlyphID()方法（传入字形名称;它将返回相应的整数ID）。

是否有一些python工具或软件工具，通过它我可以访问字体内的所有组件和表？

问题描述投票：0回答：1

1个回答

最新问题

是否有一些python工具或软件工具，通过它我可以访问字体内的所有组件和表？

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1