例如,保存已通过T-SNE转换的gensim
doc2vec模型的适当方法是什么(来自sklearn.manifold
)
x_full = model[doc_tags]
pca_full = PCA(n_components=50)
pca_result_full = pca_full.fit_transform(x_full)
tsne = TSNE(n_components=2, verbose=1)
x_tsne_full = tsne.fit_transform(pca_result_full)
其中doc_tags
是模型训练所依据的标记文档。使用T-SNE简化此模型需要花费数小时,因此最好将其保存以备将来使用。
我一直将其放在熊猫数据框中,例如df = pd.DataFrame(x_tsne_full, index=doc_tags, columns=['x', 'y'])
,然后将此数据保存到CSV以便将来使用。这是最好的方法吗,还是有一种T-SNE合适的保存方法在其文档中不明显?
我从未使用过此软件包,但我的猜测是,由于Python中的所有内容都是一个对象,因此保存tsne结果的最佳方法可能与保存任何Python对象相同。也许您可以尝试pickle套餐?如果遇到同样的问题,这就是我会尝试的方法,但是如果它不起作用,请不要犹豫,让我知道。