cosine-similarity 相关问题

余弦相似性是内积空间的两个矢量之间的相似性的度量,其测量它们之间的角度的余弦。它是两个向量之间的流行相似性度量,因为它被计算为两个向量之间的归一化点积,可以用简单的数学运算来计算。

Scipy余弦相似度与sklearn余弦相似度

我注意到scipy和sklearn都具有余弦相似度/余弦距离函数。我想测试每个向量对的速度:setup1 =“将numpy导入为np; arrs1 = [np.random ....

回答 1 投票 1

计算两个矩阵的余弦相似度

我已经定义了两个矩阵,如下所示:从scipy import linalg,mat,点a = mat([-0.711,0.730])b = mat([-1.099,0.124])现在,我想计算的余弦相似度这两个矩阵。 ...

回答 2 投票 5

提高该算法的时间复杂度

我有N对向量(集合1中的N到集合2中的N)需要通过余弦相似度配对到最接近的向量。这意味着我需要计算N ^ 2的距离并为每个元素......>

回答 1 投票 0

新文本文档与现有文档列表的余弦相似度

我有一个带有相应关键字的1000个文本文档的数据框。我想通过在列表中找到与文档最对应的关键字来提取新文档的关键字,这是最......]

回答 1 投票 0

为什么带方法“ cosine”的textstat_simil()返回NA

我正在计算两个dfm对象的余弦相似度。第一个是我的参考对象,尺寸为5 x 4,728,而第二个dfm是我的目标对象,尺寸为2,325,329 x 40,595。我...

回答 1 投票 2

数据帧中行的余弦相似度

我有一个数据集,其中每一列都有给定对象不同参数的概率。第一列是指示对象名称的字符串,而其他所有列均具有数字...

回答 1 投票 0

使用余弦相似性的K均值-Python

我正在尝试在python中实现Kmeans算法,该算法将使用余弦距离而不是欧式距离作为距离度量。我了解使用不同的距离函数可能是致命的...

回答 1 投票 12

PCA之后的sklearn余弦相似度内存错误

我有一个包含9000行(文档)和1810列(术语)的文档术语矩阵。我将PCA应用于降维,即输出9000x200矩阵。我的目的是聚类...

回答 1 投票 0

为二进制矢量的数据帧计算相似度矩阵的最佳方法是什么?

我有一个二进制矢量大小为mxn的数据帧,带有一些未填充的值,例如下面的示例col1 col2 col3 col4 col5 V0 1 0 1 V1 1 1 0 V2 0 1 0 1 ...]

回答 1 投票 0

在python中使用scipy.spatial.distance.cosine()之前是否需要规范化数据?

我有两个数据集D1和D2。每个数据集都有n个特征(列),特征值具有不同的比例。我需要找到D1中每个相关样本对之间的余弦距离,并且...

回答 1 投票 0

如何计算TF2.0中两个张量之间的余弦相似度和欧式距离?

我在模型的最后一层的末尾有两个张量(OQ,OA),其形状如下。 OQ形状:(1,600)OA形状:(1,600)这些张量的类型为'tensorflow.python.framework.ops.Tensor'How ...

回答 1 投票 0

余弦相似度以检索相似和不同的文档

我想比较两列之间的文档,并将匹配的文档排列在不同的数据框中。我无法获得类似的代码,因此寻求帮助。我用过一堆单词和tf-idf。 ...

回答 1 投票 -1

如何使用来自BERT的嵌入来比较句子相似度

我正在使用HuggingFace Transformers软件包访问预训练的模型。由于我的用例需要英语和阿拉伯语的功能,因此我使用的是基于bert-base-multilingual-cased的预训练...

回答 2 投票 1

PyTorch中的一组向量之间的成对相似矩阵

假设我们有一个3D PyTorch张量,其中第一维表示batch_size,如下所示:import torch import torch.nn as nn x = torch.randn(32,100,25)也就是说,对于每个i, ...

回答 1 投票 0

关于model()输出从`pytorch-pretrained-bert`迁移到`pytorch-transformers`问题>>

我在将代码从pytorch_pretrained_bert迁移到pytorch_transformers时遇到了麻烦。我正在尝试进行余弦相似度练习。我想提取第二个...的文字嵌入值...] >>

回答 1 投票 0

余弦相似度和余弦距离之间的差异

看起来scipy.spatial.distance.cdist余弦相似距离:链接到cos距离1 1-u * v /(|| u |||| v |||)与sklearn.metrics.pairwise.cosine_similarity不同链接到...

回答 1 投票 1

如何对2D数组和另一个向量之间的操作进行向量化?

我有一个像这样的numpy 2D数组:[[1、2],[3、4]]和一个单独的向量,如:[5、6]。在这种情况下,操作是np.inner,这是我承担余弦相似度的较大任务的一部分...

回答 2 投票 1

是否有一种方法可以使用余弦相似度与BallTree或KDTree查找最近的邻居?

我有非常稀疏和巨大的评分数据,我应该为每个会话找到前k个邻居。我需要比较近似和精确的最近邻算法,但是由于数据很大,并且...

回答 1 投票 0

使用用户的个人数据计算相似度?

我想使用他们的个人/组织数据(例如部门,公司,站点等,找出哪些用户彼此相似。我具有布尔格式的数据,如下所示:...

回答 2 投票 1

2个熊猫df列之间的余弦相似度以获取余弦距离

我有一个数据帧,如下所示:vector_a vector_b [1,2,3] [2,5,6] [0,2,1] [2,9,1] [4,7,1] [1, 7,4]我想做sklearn的余弦相似度...

回答 1 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.