similarity 相关问题

相似性度量量化了对象(例如文档,特征向量)的相似程度。

许多矩阵对之间的相似性/距离

我想通过计算每对中所有(多维)点集之间距离的平均值来量化组相似度。我可以轻松地为每对组手动完成这个操作......

回答 3 投票 2

度量学习与相似性学习

我很难找到关于相似性学习的任何全面的解释。根据我的收集,它与度量学习相同,除了它试图学习相似性函数而不是...

回答 1 投票 -1

是否有任何解决方案来获得单词列表之间的相似性得分?

我想计算单词列表之间的相似度,例如:import math,re from collections import Counter test = ['address','ip'] list_a = ['identifiant','ip','address','fixe ','......

回答 1 投票 0

如何将一对向量馈送到分类器以对类似/不相似进行分类

我试图将文档向量对(Doc2Vec,每个文档300个特征)分类为相似/不相似。我尝试了远程色彩(余弦等)以及文档大小等附加功能但是...

回答 1 投票 -1

协作过滤:非个性化的项目到项目的相似性

我正在尝试按照亚马逊的“观看/购买X的客户也查看/购买过Y和Z”来计算物品间的相似度。我见过的所有例子和参考资料都是......

回答 4 投票 4

如何用bray-curtis相似度值绘制椭圆?

我想进行nMDS分析,我想在我的图形中添加代表bray-curtis相似度百分比的椭圆,但我不知道如何用R做这个,你可以做这种类型的图形......

回答 1 投票 0

NER(命名实体识别)文档中句子之间的相似性

我一直在使用spacy来查找句子的NER。我的问题是我必须计算两个不同文档的句子之间的NER相似性。是否有任何配方或包装......

回答 2 投票 1

决定文本或句子在内容上是等同的

确定相似度作为距离Word Mover距离的经典示例,例如https://markroxor.github.io/gensim/static/notebooks/WMD_tutorial.html,GoogleNews上的word2vec模型-...

回答 1 投票 0

ExactStatsCache不适用于分布式IDF

我在SolrCloud(7.7.1)中使用ExactStatsCache,为所有集合添加了solrconfig.xml文件。 一世 ...

回答 1 投票 0

如何根据特定标准从一组到我的测试项目中找到最相似的项目?

我有一组玩家和各种统计数据。这是该文件的示例。名字nat tm年龄pos cm kg app \0HéctorBellerín阿森纳......

回答 2 投票 0

计算文本之间的相似性以查找重复项

我有一些类似于以下的数据,通过我处理数据的方式,我确实有一些重复/重复的行,这是有点不可避免的。我想计算余弦...

回答 1 投票 0

如何找到一个文本类似于另一个文本的部分?

我们知道如何通过Word Mover的距离来评估两个整个文本的相似性。如何找到一个与另一个文本相似的文本?

回答 1 投票 0

LSI关键字 - NLP关键字提取 - PHP RAKE / MAUI

我试图找到从给定文本中提取类似关键字的最佳方法或算法。我搜索了很多,发现了RAKE / MAUI和其他NLP算法,但它们并没有完全符合我的要求。一世 ...

回答 1 投票 0

quanteda:计算两个DFM之间的行的文本相似度

我有一个带有2个文本字段的数据框:评论和主要帖子基本上这是结构id评论post_text 1“我认为blabla ..”“...

回答 1 投票 1

短语之间的相似性得分

Levenshtein距离是一种测量单词之间差异的方法,但对于短语则不然。是否有一个很好的距离度量来衡量短语之间的差异?例如,如果......

回答 2 投票 0

Python:如何删除重复/类似的行

我有一个包含大量消息的文件。每行都是一个独特的消息,它们的结构相似,略有修改。一个例子如下:第10行的错误号609 ......

回答 2 投票 0

如何提高数据帧内字符串相似度得分的计算速度?

我有一个数据框如下:df = pd.DataFrame(data = [[1,'Berlin',],[2,'Paris',],[3,'Lausanne',],[4,'Bayswater', ],[5,'桌湾',],[6,'北京',],......

回答 1 投票 0

在Python中获取文本和集合文本之间的相似性

我正在为Twitter构建一个事件检测器,它受到垃圾邮件的极大影响,所以我打算用文本相似度算法过滤一下推文。我认为的方法......

回答 1 投票 0

有效地计算大的相似度矩阵

在我目前正在工作的项目中,大约有200,000名用户。对于这些用户中的每一个,我们针对其他用户定义了相似性度量。这产生200000x200000的相似性矩阵。一个 ...

回答 4 投票 1

如何在Python中计算包含字符串的两个列表的Jaccard相似度?

我有两个用户名列表,我想计算Jaccard相似度。可能吗?这个帖子展示了如何计算两个字符串之间的Jaccard相似度,但是我想应用...

回答 7 投票 9

© www.soinside.com 2019 - 2024. All rights reserved.