单词嵌入的语义加权平均值

问题描述投票：2回答：1

给定一个单词嵌入向量列表，我试图计算一个平均单词嵌入，其中一些单词比其他单词更有意义。换句话说，我想计算一个语义加权的单词嵌入。

我找到的所有东西都只是找到平均向量（当然这非常简单），它表示列表的平均含义或文档表示的某种加权平均值，但这不是我想要的。

例如，给定['sunglasses', 'jeans', 'hats']的单词向量，我想计算这样一个向量，它代表那些单词的语义，但'sunglasses'具有更大的语义影响。因此，在比较相似性时，单词'glasses'应该比'pants'更类似于列表。

我希望这个问题很清楚，非常感谢你！

python vector semantics word2vec word-embedding

1个回答

1
投票

实际上，字矢量的平均可以以两种方式完成

没有tfidf权重的单词向量的平均值。
Word向量的平均值乘以tfidf权重。

这将解决您的重要性问题。

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.