从Ob告中提取死亡名称实体 - NLP

问题描述 投票:0回答:2

我有一连串的广告,这是从一些报纸中提取的。广告可能会以如下所示的格式显示:我的任务是提取已故人员的姓名。

John, the small son of Mr. and Mrs.<br>
Elmer Cleppfer, died at their home in<br>
Lewistown on Wednesday. The funeral<br>
will He held on Saturday afternoon<br>
from the home of the grandparents<br>
on the child, Mr. and Mrs. John<br>
Kiopper, 224 Locust street, tortiorrow<br>
afternoon at 2 o'clock. Interment witt<br>
take place at Oberlin.<br>

Mrs. Lydia Mintch, aged 6S years <br>
died yesterday afternoon at the home<br>
of Fred Flowerfleld at Enhaut. Mrs.<br>
Mlnlch contracted a severe attack of<br>
pneumonia aggravated by other illness<br>
Several days ago which resulted in her<br>
death. Funeral arrangements have not<br>
yet been completed.<br>

整个段由2个广告组成。如果有超过1个这样的广告,任何人都可以告诉我如何将这类文本分类成段落吗?

nlp nltk stanford-nlp text-processing ner
2个回答
0
投票

那么Stanford Parser是你的选择。

  1. 首先只提取包含死亡,减少或这些术语的内容的句子。
  2. 使用Stanford Parser为这些句子生成折叠的类型依赖项。
  3. 你会发现一个模式,可以帮助你得到减少的人的名字。

我故意不放弃这里的模式,因为你也应该付出努力。


0
投票

这是我如何处理这个问题。

  1. 获取句子POS标记。
  2. 对于每个句子,深度解析并创建subject-verb-object模型。 (从左到右解析)。
  3. 在动词指向死亡的地方,主体是死人。
© www.soinside.com 2019 - 2024. All rights reserved.