我读过有关断字,我才知道,断字依赖于词典中,我们使用了特定的语言。对于一些的话比LibreOffice的不同的Microsoft Office的叫法。我试图打开dictionaryhyph_en_US.dic
但不明白的内容。我没有得到的是,在字典中是如何使用的。
注:我知道他们使用的算法以及使断字更好,但在何种程度上的字典中发挥作用?
任何帮助都感激不尽。
问候,ANKUR巴德瓦杰
LibreOffice的喜欢的TeX和许多其它程序的使用由富兰克林M.梁创建的断字算法。该算法采用模式匹配技术,关键词,找到断字点。包含图案A单独的字典文件用于每一种语言。据Franklin M. Liang's thesis:
这些模式中找到一本袖珍字典单词表中的连字符的89%,基本上没有错误。
至于字是怎么做的,这是很难说的,因为它是专有软件。我的猜测是,它不使用这样的算法,但在添加了100%正确的断字点真正的字典,这可以解释为什么断字是不同的,在Word中更准确。