information-retrieval 相关问题

信息检索是一个研究领域,涉及从非结构化或半结构化数据集合中检索文档,信息或元数据。

如何使用spaCy的基于规则的匹配来提取句子?

下午好,我正试图使用spacy来提取法语句子,从一个列表到另一个包含特定模式的句子。...

回答 1 投票 0

为什么添加非相关文档能提高系统性能?以及如何评估新的结果?

假设一个IR系统响应来自10,000个文档集合的查询,返回一个20个文档的排序列表。如果将5,000个非相关文档添加到集合中,我们发现 ...

回答 1 投票 -1


基于矩阵乘法检索文件。

我有一个模型,在多维向量空间中表示文档的集合。所以,例如,对于100k个文档,我的模型以300维向量的形式来表示它们。所以,...

回答 1 投票 0

计算余弦相似性

我想知道如何计算这两个向量的余弦相似性。A:(1,1,0,0,0,0,0,0,0,0) B:(1,0,0,1,0,0,0,1) 根据我的理解, 我需要将A乘以B然后除以... ...

回答 1 投票 0

无法连接到Docker中的Elasticsearch。

我无法在docker内连接到kubernetes中的elasticsearch。我的elasticsearch是通过kubernetes访问的,我有一个名为 "radius_ml_posts "的索引。我正在使用 elasticsearch 的 python ...

回答 1 投票 0

比较使用不同功能的两种算法

我有一组o规则,所有规则都从长文本中提取相同类型的实例(例如,城市名称)。我正在比较以下两种算法:Algorithm1:Algorithm2:知道...

回答 1 投票 0

生物医学名称实体识别的预先训练框架

是否存在经过培训的生物医学名称实体识别框架?谢谢和亲切的问候。

回答 1 投票 0

无法检索从控制器传递的值。 Laravel

我在将值从控制器传递到下一个控制器时遇到麻烦。我使用了以下代码:在BillController中:return redirect('pdf')-> with($ sid);在路线中:Route :: get('pdf','...

回答 1 投票 0

有人可以检查我的tf-idf加权是否正确吗?

我收集了15个文件,其中10个词中出现了吸烟,其中2个词中出现了健康。我需要在tf-idf加权之后检查这些项的值...

回答 1 投票 0

如何在Lucene QueryParser中指定两个字段?

我阅读了如何在QueryParser中合并多个字段?但是我不明白。目前,我有一个非常奇怪的结构,例如:parser = New QueryParser(“ bodytext”,Analyzer)parser2 = New ...

回答 2 投票 65

Elasticsearch未显示任何匹配。 Python查询正确

第一篇文章。我知道之前已经有人问过这个问题,但是我根据以前的解决方案对代码进行了修改,但是仍然无法正常工作,并且该线程已关闭,因此我正在创建一个新线程。请忍受。...

回答 1 投票 0

如何计算短文本语料库的语义相似度?

两个短文本语料库之间无监督地比较语义相似性的正确方法是什么?比较两者的LDA主题分布似乎不是一个解决方案,就像简短的...

回答 1 投票 0

将非结构化文本的组提取到以后的NLP中?

我是数据挖掘/文本挖掘的新手,所以我不确定我使用的是正确的术语。我试图提出一个提取相关内容组以稍后应用NLP和...

回答 1 投票 0

使用k-gram索引的主题分类

我有一组主题,每个主题都有一个关键字列表。 {体育:['罗纳尔多·梅西·齐达内','足球棒球','巴塞罗那皇家'] ...}任务是对特定文件进行分类。 ...

回答 1 投票 0

此功能未显示文件名……如何解决?

名称未从test_images中显示出来。在此路径中,有四个图像???如何解决此图像路径=“ C:/ Users / Saad / new Conuting obj / test_images /” import os import glob imagesList = ...

回答 1 投票 0

从纯文本中提取结构化数据的实用方法:寻找想法和反馈

我是一个本地乘车分享Facebook组的成员。该小组专门针对两个城市以及介于两者之间的所有事物,因此该职位(主要)是这样的:“我要从城市A开车到城市Z ...

回答 1 投票 0

如何存储倒排索引?

我最近制作了一个约内存中有2,000,000个文档。这些文档是从mysql datbase导入的,加载大约需要6到10秒。每次启动程序时,都是...

回答 1 投票 0

使用(V1)python SDK API训练Watson Discovery无效

我想使用Watson Discovery V1 API进行相关性培训。我尝试了以下方法,但尚未获得理想的结果。下面详细描述该问题:我有一组文档,其中一些...

回答 1 投票 0

快速/优化python中的N-gram实现

哪个ngram实现在python中最快?我试图剖析nltk和scott的zip(http://locallyoptimal.com/blog/2013/01/20/elegant-n-gram-generation-in-python/):从nltk.util导入...] >

回答 3 投票 11

© www.soinside.com 2019 - 2024. All rights reserved.