我已经建立了一个 Doc2Vec 模型,并且正在尝试获取我所有测试集的向量(176 个点)。下面的代码我一次只能看到一个向量。我希望能够执行“clean_corpus[404:]”来获取整个数据集,但是当我尝试这样做时它仍然输出一个向量。
model.save(r'F:\LLNL\d2v.model')
print("Model Saved")
from gensim.models.doc2vec import Doc2Vec
model= Doc2Vec.load(r'F:\LLNL\d2v.model')
#to find the vector of a document which is not in training data
test_data = clean_corpus[404]
v1 = model.infer_vector(test_data)
print("V1_infer", v1)
有没有一种方法可以轻松迭代模型以获取并保存所有 176 个向量?