我试图通过类似word2c的神经网络(Using Word2Vec for polysemy solving problems)解决单词多义问题(修复文本中多义词的WordNet-synsets),但结果太差了。什么是其他最先进的解决单词polysemy / homonymy的算法?你能给我一些文章吗?
你可以从spacy的sense2vec实现开始。它基于原始的sense2vec paper。从摘要:
本文提出了一种新方法,通过基于监督消歧为每个单词建立多个嵌入来解决这些问题,这为消费NLP模型选择有意义歧义的嵌入提供了一种快速而准确的方法。我们证明这些嵌入可以消除对比感官的歧义,例如名义和言语感觉以及细微差别,如讽刺。
在this page,你可以找到NLP STATE-OF-THE-ART出版物和排名,特别是word sense disambiguation - WSD SOTA。您可能对supWSDemb和UKB感兴趣,它们目前分别是受监督和无监督的SOTA。