我正在尝试将 Preeti 字体文本转换为 unicode。我正在使用 Python 和 npTTF2UTF 库。它在大多数情况下都有效,但它也会将“Microwave”等英语单词转换为等效的 unicode。我怎样才能避免这种情况?
这是我的代码:
import npttf2utf
mapper = npttf2utf.FontMapper("npttf2utf-main/src/npttf2utf/map.json")
text = ''' cGo g]6js{;Fu cfj4 x"g] :yfg, tl/sf / lsl;d like (Microwave/Satellite/Cable etc.) '''
converted_text = mapper.map_to_unicode(word, from_font="Preeti", unescape_html_input=False, escape_html_output=False)
print(converted_text)
我得到: अन्यनेटवर्कसँगआवद्धहूनेस्थान,तरिकारकिसिमष्पिभ ९ःष्अचयधबखभरक्बतभििष्तभरऋबदभि
我不想将 'lsl;d'(किसिम) 之后的文本转换为 unicode。我怎样才能做到这一点?
提取文本及其字体信息(PyMuPDF具有此功能)并仅转换设置为具有Preeti字体的部分。