cosine-similarity 相关问题

余弦相似性是内积空间的两个矢量之间的相似性的度量,其测量它们之间的角度的余弦。它是两个向量之间的流行相似性度量,因为它被计算为两个向量之间的归一化点积,可以用简单的数学运算来计算。

使用余弦相似性的K均值-Python

我正在尝试在python中实现Kmeans算法,该算法将使用余弦距离而不是欧式距离作为距离度量。我了解使用不同的距离函数可能是致命的...

回答 1 投票 12

PCA之后的sklearn余弦相似度内存错误

我有一个包含9000行(文档)和1810列(术语)的文档术语矩阵。我将PCA应用于降维,即输出9000x200矩阵。我的目的是聚类...

回答 1 投票 0

为二进制矢量的数据帧计算相似度矩阵的最佳方法是什么?

我有一个二进制矢量大小为mxn的数据帧,带有一些未填充的值,例如下面的示例col1 col2 col3 col4 col5 V0 1 0 1 V1 1 1 0 V2 0 1 0 1 ...]

回答 1 投票 0

在python中使用scipy.spatial.distance.cosine()之前是否需要规范化数据?

我有两个数据集D1和D2。每个数据集都有n个特征(列),特征值具有不同的比例。我需要找到D1中每个相关样本对之间的余弦距离,并且...

回答 1 投票 0

如何计算TF2.0中两个张量之间的余弦相似度和欧式距离?

我在模型的最后一层的末尾有两个张量(OQ,OA),其形状如下。 OQ形状:(1,600)OA形状:(1,600)这些张量的类型为'tensorflow.python.framework.ops.Tensor'How ...

回答 1 投票 0

余弦相似度以检索相似和不同的文档

我想比较两列之间的文档,并将匹配的文档排列在不同的数据框中。我无法获得类似的代码,因此寻求帮助。我用过一堆单词和tf-idf。 ...

回答 1 投票 -1

如何使用来自BERT的嵌入来比较句子相似度

我正在使用HuggingFace Transformers软件包访问预训练的模型。由于我的用例需要英语和阿拉伯语的功能,因此我使用的是基于bert-base-multilingual-cased的预训练...

回答 2 投票 1

PyTorch中的一组向量之间的成对相似矩阵

假设我们有一个3D PyTorch张量,其中第一维表示batch_size,如下所示:import torch import torch.nn as nn x = torch.randn(32,100,25)也就是说,对于每个i, ...

回答 1 投票 0

关于model()输出从`pytorch-pretrained-bert`迁移到`pytorch-transformers`问题>>

我在将代码从pytorch_pretrained_bert迁移到pytorch_transformers时遇到了麻烦。我正在尝试进行余弦相似度练习。我想提取第二个...的文字嵌入值...] >>

回答 1 投票 0

余弦相似度和余弦距离之间的差异

看起来scipy.spatial.distance.cdist余弦相似距离:链接到cos距离1 1-u * v /(|| u |||| v |||)与sklearn.metrics.pairwise.cosine_similarity不同链接到...

回答 1 投票 1

如何对2D数组和另一个向量之间的操作进行向量化?

我有一个像这样的numpy 2D数组:[[1、2],[3、4]]和一个单独的向量,如:[5、6]。在这种情况下,操作是np.inner,这是我承担余弦相似度的较大任务的一部分...

回答 2 投票 1

是否有一种方法可以使用余弦相似度与BallTree或KDTree查找最近的邻居?

我有非常稀疏和巨大的评分数据,我应该为每个会话找到前k个邻居。我需要比较近似和精确的最近邻算法,但是由于数据很大,并且...

回答 1 投票 0

使用用户的个人数据计算相似度?

我想使用他们的个人/组织数据(例如部门,公司,站点等,找出哪些用户彼此相似。我具有布尔格式的数据,如下所示:...

回答 2 投票 1

2个熊猫df列之间的余弦相似度以获取余弦距离

我有一个数据帧,如下所示:vector_a vector_b [1,2,3] [2,5,6] [0,2,1] [2,9,1] [4,7,1] [1, 7,4]我想做sklearn的余弦相似度...

回答 1 投票 2

两个不同长度的数据帧的列之间的余弦相似度?

我在df1中有一个文本列,在df2中有一个文本列。 df2的长度将与df1的长度不同。我想针对df1 [text]中的每个条目对每个条目求余弦相似度...

回答 1 投票 0

删除TFIDF结果的同义词在python中

我目前正在从事一个项目,该项目使用python中的tfidf获得文档集中最相关的10个单词。但是,在相同的单词及其复数形式或副词形式上会有结果...

回答 1 投票 0


如何在语义上比较两个句子?

我正在尝试为大学构建一个应用程序,以便学生可以在其上进行考试,但是我遇到了文章问题,我无法将学生的答案与...的答案进行比较。]] >

回答 1 投票 1

如何对某些术语进行额外加权的TF-IDF评分

我目前有一个tf-idf系统用于评分,并且我使用余弦相似度进行搜索。我想添加额外的权重,以考虑给定术语是否位于...

回答 1 投票 0

余弦相似度图混杂在一起,名称一起运行

我有一小部分要绘制余弦相似度的文档。文档名称很长,我不知道如何防止它们在绘图上一起运行。这是文件名...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.