cosine-similarity 相关问题

余弦相似性是内积空间的两个矢量之间的相似性的度量,其测量它们之间的角度的余弦。它是两个向量之间的流行相似性度量,因为它被计算为两个向量之间的归一化点积,可以用简单的数学运算来计算。

大矩阵上的余弦距离

我有一个大小为 (100000, 100) 的嵌入矩阵。 我想计算矩阵中所有成对的余弦距离。我尝试过使用 sklearn.metrics.pairwise.cosine_distances 函数,但它

回答 1 投票 0

计算SPARQL中的余弦相似度

我正在寻找一种使用 SPARQL 计算余弦相似度的方法。 RDF 数据中向量的描述如下: @前缀rdf:。 @前缀rdfs:<...

回答 1 投票 0

两幅图像特征之间的每像素余弦相似度

我们有两个 3D 矩阵 HxWxC,其中 H、W 是 2D 图像的尺寸,C 是每像素特征。我们想要计算 fi 的每个像素特征的 arg-最大余弦相似度...

回答 1 投票 0

将Python推荐系统连接到Laravel应用程序

我使用Python和余弦相似度算法开发了一个基本的推荐系统。现在,我有兴趣创建一个 Laravel 应用程序来集成这个推荐系统。然而...

回答 1 投票 0

余弦相似度的输出不符合预期

我正在尝试生成句子中两个单词之间的余弦相似度。这句话是“黑猫坐在沙发上,棕色狗睡在地毯上”。 我的Python代码如下...

回答 1 投票 0

如何获取文档查询的余弦相似度分数

我正在做一个文本分类程序,其中我有一个包含 5 个类别的数据集(“商业”、“娱乐”、“本地”、“体育”、“世界”)。该数据集包含 5 个文件夹(针对 5 个类),共 100 txt ...

回答 1 投票 0

R:平均余弦相似度分数的 For 循环

我正在尝试使用 R 中 stringdist 包中的 stringsim 来计算两组文本之间的余弦相似度分数。这些文本是存储在两个单独的字符向量中的词干标记。

回答 1 投票 0

使用余弦相似度搜索现有 ChromaDB 数据库

我有一个预先存在的数据库,其中存储了大约 15 个 PDF。我希望能够搜索数据库,以便使用余弦模拟在给定特定阈值的情况下获得 X 个最相关的结果...

回答 1 投票 0

TfIdfVectorizer:固定词汇的向量化器如何处理新词?

我正在研究约 10 万篇研究论文的语料库。我正在考虑三个领域: 纯文本 标题 抽象的 我使用 TfIdfVectorizer 获取明文字段的 TfIdf 表示形式并提供

回答 1 投票 0

余弦相似度全部与 df 列中的全部:矢量化和存储结果?

我正在使用 pandas 数据框,我需要根据名为 text_original (~2k 行)的特定列中的文本内容计算所有行对之间的余弦相似度。我的目标...

回答 1 投票 0

设置两两距离和余弦相似度的范围在0到1之间

我编写了一个 BiLSTM-Siamese 网络,使用成对距离和余弦相似度来测量字符串相似度,详细信息如下: 类 SiameseNetwork(nn.Module): def __init__(自我,

回答 1 投票 0

sklearn中可以使用余弦距离进行Kmeans聚类吗?

我想使用 Sentence Transoformer 中的 BERT 嵌入对我的文档进行聚类,尤其是 bert-base-nli-mean 标记,并且我想使用 kmeans 聚类对该嵌入进行聚类,但我有一个问题...

回答 1 投票 0

计算两个数组之间的余弦相似度并将结果保存在矩阵中

我有两个数组,A (size = (20, 200) 和 B (size = (15, 200))。我想构造一个矩阵 C (size = (20, 15)) s.t c[i, j]存储元素A[i]和B[j]之间的余弦相似度。 我可以做到

回答 2 投票 0

将经过训练的机器学习模型与 React Native 应用程序集成

我有一个 FYP 项目(一个像 Instagram 这样的社交媒体应用程序),需要我创建一个简单的推荐系统。我已经使用 Python 训练了我的数据集的余弦相似度,但我不知所措......

回答 1 投票 0

获取 RequestError(400, 'search_phase_execution_exception', 'runtime error') 以获得相似性

我尝试使用tensorflow_hub通过Elasticsearch进行语义搜索,但我得到 RequestError: RequestError(400, 'search_phase_execution_exception', 'runtime error') 。来自

回答 4 投票 0

为什么完全相同的向量之间的火炬余弦相似度给出的相似度为零而不是一?

我有两个张量,我想在Pytorch中计算它们之间的余弦相似度: a = torch.tensor([[0.,0.,0.,0.,0.]]) b = torch.tensor([[0.,0.,0.,0.,0.]]) 我计算余弦相似度

回答 1 投票 0

为什么余弦相似度总是算为1?

在做学校项目时,遇到一个问题,余弦相似度总是测量为1。我无奈地质疑余弦相似度总是测量为1,因为......

回答 1 投票 0

数据框中每两行之间的余弦相似度

我有一个名为文本的数据框,有两列,年份和文本。查找下面的 dput 输出作为示例: 文字 <- structure(list(year = 2000:2007, text = c("I went to McDonald's and they ...

回答 2 投票 0

R - 数据框中每两行之间的余弦相似度

我有一个名为文本的数据框,有两列,年份和文本。查找下面的 dput 输出作为示例: 文字 <- structure(list(year = 2000:2007, text = c("I went to McDonald's and they ...

回答 1 投票 0

比较 R 中两列中每行中存储的文本

我有2个向量 a=c("abc","def","ghi","jkl") b=c("abc","dez","gyx","mno") 如何获得余弦值进行比较

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.