将在SpaCy中使用预训练单词嵌入计算出的余弦相似性分数可视化

问题描述 投票:2回答:1

我已经使用SpaCy的预训练模型'en_core_web_lg'来找到一组值和属性之间的余弦距离。我想形象化一个单词与另一个单词有多接近的关系,与聚类非常相似。

Here is the link to the table which contains similarity scores for each value vs attribute

这里的列是我试图为其找到相似度得分的属性,而行是我试图找到其最有可能被归类的属性的值

This is the output i am trying to achieve. Please take a look at it

python-3.x nlp spacy word-embedding
1个回答
0
投票

如果您想要类似的图:tSNE plot您需要将单词向量的维数减少到2维

因此,您必须将所需的降维算法应用到所需的词向量上,例如t-SNE(也在scikit-learn中实现)。

相似度分数不足以做到这一点; 您需要完整的向量

Here,有一个关于t-SNE的很好的Kaggle教程,用于可视化单词向量。您可以自定义它,仅选择您感兴趣的词。

© www.soinside.com 2019 - 2024. All rights reserved.