similarity 相关问题

相似性度量量化了对象(例如文档,特征向量)的相似程度。

将每个字符串与数据框中的所有其他字符串进行比较

我有这个数据框: 我的列表 = [ “使用银行账户 XXXXXXXX534311 Feb 2023,20:42:25 向 Rupam Sweets 支付 67.00 卢比”, “使用银行账户 XXXXXXXX 向 Rupam Sweets 支付 66.00 卢比...

回答 2 投票 0

构建 doc2vec 模型并使用 gensim 查找文本相似的评论

数据集是Amazon的gz文件中的评论数据集。 # 在特定路径读取压缩数据的函数 # # 如何使用: # PATH = "/路径/到/文件" # 解析中的行(PATH): # 做点什么...

回答 0 投票 0

如何评估 5 个数据点与 1 个目标数据点的相似程度

我正在努力解决我需要解决的问题。 假设我们有一个汽车数据集 (1),其中包含许多具有不同特征(id、年龄、里程、颜色、型号……)的不同汽车。哦...

回答 1 投票 0

gensim是如何做到如此快速地找到最相似的单词的?

比方说,我们训练一个有超过100万个单词的模型。为了找到最相似的词,我们需要计算测试词的嵌入和所有1 ... 的嵌入之间的距离。

回答 1 投票 0

有没有什么方法可以找到两个语料库之间的相似度?

我想测量两个语料库的相似度。我目前尝试过的相似度检查有以下几种。贾卡德相似度 Dice's系数 Spearman's rank correlation coefficient Chi2 test...

回答 1 投票 0

使用for循环比较文本时出现类型错误。

我正在尝试比较从不同网站抓取的文本。我有一个从数据框架的一列中获取的文本列表。为了比较这个列表中的文本,我尝试使用相似性(我做 ...

回答 2 投票 1

使用OpenCV来验证所画的线与计算机生成的线的相似性。

在Python和OpenCV中,我希望验证我所画的线与计算机所画的线是一样的(或者说 ...

回答 1 投票 0

关于维度的诅咒

我的问题是关于这个话题我看了一下。基本上我的理解是,在更高的维度上,所有的点最终都会非常接近对方。我的疑问是,是否 ...

回答 2 投票 4

我应该用什么来做聚类词相似性? 以及Python中的可视化聚类。

我有一个相似度词的矩阵。Noun1 能力 缺席 丰度 重音 访问 访问 账号 准确度 Noun2 能力 1.00000 0.453362 0.374926 0.174432 0.448402 0.209143 ....

回答 1 投票 0

找出与OOV词最相似的词

我正在使用gensim寻找词汇外的OOV词的最相似词。类似这样: def get_word_vec(self, model, word): try: if word not in model.wv.vocab: ...。

回答 1 投票 0

如何用OpenCV评估两张图片的相似度?

OpenCV是否支持比较两张图片,返回一些值(也许是百分比)来表示这些图片的相似度?例如,如果同一个图像被传递了两次,就会返回100%,......。

回答 4 投票 137

是否可以用自定义命名的实体来改进spaCy的相似性结果?

我发现spaCy的相似性在使用 "en_core_web_lg "开箱即用的情况下对我的文档进行比较时做得很好。我想收紧一些领域的关系,并认为添加自定义 ...

回答 1 投票 1

pandas中余弦相似度的行计算,无需循环。

我有一个有很多行的pandas数据框df。对于每一行,我想计算行的列A(第一向量)和行的列B(第二向量)之间的余弦相似度。在最后,我 ...

回答 1 投票 0

计算两组凸多边形的相似度?

我已经用不同的算法生成了两组凸多边形。每个集合中的每个多边形都由一个坐标数组[n_points,xy_coords]来描述,因此正方形由一个数组来描述...

回答 1 投票 0

我如何用语言模型扩展Lucene?

大家晚上好!因此,我有一个项目“使用语言模型扩展lucene”,我尝试向代码中添加2、3行,如下所示:在search.java上LMDirichletSimilarity相似= new ...

回答 1 投票 0

测量不同图像之间的相似性?

我想比较不同图像之间的相似性。我知道有比较有用的方法,但是在我的情况下,所有图像都经过resnet预处理,因此我的数据集看起来像(N,1000)...

回答 1 投票 0

如何在WordNet中找到两个同义词集之间的语义关系

我正在使用WordNet 3.0。我想知道如何在WordNet层次结构中的两个同义词集之间找到语义关系。如,给定两个单词作为输入,我想找到关系...

回答 3 投票 2

如何查找单词列表之间的语义相似性?

输入:listToStr ='变性剂alpha替代amd分析血管生成抗抗vegf似乎与基于最佳贝伐单抗失明的血液相关联'代码我正在使用:simi = []令牌= nlp(...

回答 1 投票 0

文件相似功能

我正在尝试为文档的余弦和欧氏距离创建矩阵。不太确定我将如何处理这个问题。任何意见,将不胜感激。谢谢。该函数采用...

回答 1 投票 0

通过大熊猫的曲线识别“相似”数据集

考虑以下导入熊猫为pd导入numpy为np df = pd.DataFrame({'y':np.sin(np.linspace(1,100,10000)),'x':pandas.date_range('2019-01 -01','2020-01-01',periods = 10000})df.index = df ['...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.