spaCy中的DocBin.merge方法

问题描述 投票:0回答:1

以下代码不起作用,仅在文档here中建议!

import spacy # V2.2
from spacy.tokens import DocBin # V2.2
nlp = spacy.load('en_core_web_sm') # V2.2

doc_bin1 = DocBin(attrs=["LEMMA", "POS"])
doc_bin1.add(nlp("Hello world"))
doc_bin2 = DocBin(attrs=["LEMMA", "POS"])
doc_bin2.add(nlp("This is a sentence"))
merged_bins = doc_bin1.merge(doc_bin2)
assert len(merged_bins) == 2

返回以下错误:

---> assert len(merged_bins) == 2
TypeError: object of type 'NoneType' has no len()

解决方案是什么?

python serialization merge spacy doc
1个回答
0
投票

这在示例中看起来像是一个错误。 doc_bin1.merge(doc_bin2)合并doc_bin2doc_bin1,并且不返回任何值。最后几行应为:

doc_bin1.merge(doc_bin2)
assert len(doc_bin1) == 2
© www.soinside.com 2019 - 2024. All rights reserved.