NLP命名实体识别

问题描述 投票:0回答:1

我是NLP的新手。我想使用命名实体识别算法从文本中提取名称和位置,而不使用任何库。

例如:美国航空表示将直接飞往班加罗尔。回答:实体:美国航空地点:班加罗尔

命名实体的最佳做法是什么?就像将所有名称和位置存储在CSV文件中并与句子进行比较吗?

machine-learning nlp stanford-nlp named-entity-recognition
1个回答
0
投票

您可以通过多种方式实现命名实体识别:

  1. 一个人可以将此问题视为多类分类问题,其中命名实体是我们的标签,因此我们可以应用不同的分类算法。这种方法的问题是我们错过了句子中单词的上下文。识别和标记单词需要彻底理解句子中的单词。

  2. 要构建最新的NER,我们需要深入研究深度学习方法。众所周知,单词的上下文起着重要的作用,考虑到文本是一种顺序数据格式Long Short Term Memory (LSTM)起着重要的作用。并非任何类型的LSTM都能提供最佳结果。我们需要使用Bi-Directional LSTM,因为标准LSTM在文本序列中使用过去信息进行预测。对于NER,由于上下文依次覆盖了过去和将来的标签,因此我们需要同时考虑过去和将来的信息。 Bi-Directional LSTM是两个LSTM的组合-一个从从右到左向前运行,另一个从从左到右向后运行。

© www.soinside.com 2019 - 2024. All rights reserved.