我有一个销售的csv记录,每个记录都有列客户名称。此列是人员姓名和组织名称的组合。如何使用spacy来检测此列是个人还是组织?
这是一个“命名实体识别”任务。 Spacy有一个非常好的documentation:
doc = nlp(u'Apple is looking at buying U.K. startup for $1 billion')
for ent in doc.ents:
print(ent.text, ent.start_char, ent.end_char, ent.label_)
Apple 0 5 ORG