给定一个文本,我想查找与文本中提到的命名实体相关的所有维基百科页面的链接。有没有一种可靠的方法可以做到这一点?
例如,考虑一下这段文字。
马克-艾略特-扎克伯格是美国互联网企业家和慈善家。
" 鉴于此,我看输出的是以下链接。
以目前NLP的现状来看,这可能吗?非常感谢!
正如@Jindřich告诉你的,你无疑应该看看实体链接,有时也是(命名的)实体歧义或 "维基化"。学术界在这个问题上已经做了很多工作(看看TAC、KBP、NEEL的挑战)。
许多软件都能做到这一点,仅举几例。
要知道,结果在很大程度上取决于你要处理的文本种类,你可能需要在使用它们之前评估软件的可靠性。