如何查找与命名实体相关的所有维基百科页面?

问题描述 投票:0回答:1

给定一个文本,我想查找与文本中提到的命名实体相关的所有维基百科页面的链接。有没有一种可靠的方法可以做到这一点?

例如,考虑一下这段文字。

马克-艾略特-扎克伯格是美国互联网企业家和慈善家。

" 鉴于此,我看输出的是以下链接。

以目前NLP的现状来看,这可能吗?非常感谢!

nlp mediawiki stanford-nlp wikipedia named-entity-recognition
1个回答
1
投票

你要解决的问题叫做 实体链接. 有许多学术论文讨论了这个问题的解决方案,但只有很少的论文提供了一个实现。

OpenTapioka 牛津大学的 开源实施 和一个 在线演示.

特警队 比萨大学有一个 公开的API.


1
投票

正如@Jindřich告诉你的,你无疑应该看看实体链接,有时也是(命名的)实体歧义或 "维基化"。学术界在这个问题上已经做了很多工作(看看TAC、KBP、NEEL的挑战)。

许多软件都能做到这一点,仅举几例。

要知道,结果在很大程度上取决于你要处理的文本种类,你可能需要在使用它们之前评估软件的可靠性。

© www.soinside.com 2019 - 2024. All rights reserved.