information-retrieval 相关问题

信息检索是一个研究领域,涉及从非结构化或半结构化数据集合中检索文档,信息或元数据。

在nlp中是否有用于事件跟踪的项目或成熟模型?

我刚刚开始使用nlp。最近,我有一个用于新闻事件提取和跟踪的项目。主要任务是提取事件(不限于ACE 2005格式)并在...

回答 1 投票 0

JavaFX应用程序非常慢

我们在课程项目中建立了一个信息检索引擎。我们被要求使用JavaFX运行程序。问题在于该项目非常繁忙,其中包括:解析文档(460,...

回答 1 投票 0

使用JAVAFX的运行程序非常慢

我们在课程项目中构建了一个信息检索引擎。我们被要求使用JAVAFX运行我们的程序。问题是该项目非常繁忙,其中包括:解析文档(460,000 ...

回答 1 投票 0

快速文本预训练句子相似度

我想使用快速文本预训练模型来计算一组句子之间的相似度。谁能帮我?最好的方法是什么?我通过...

回答 1 投票 0

在WordCloud中将单词聚在一起

我正在使用wordcloud库在python中使用词云。例如,我想从以下列表中创建wordcloud:word_ls = ['北方的果园种植者','苹果的果园种植者',...

回答 1 投票 0

如何对某些术语进行额外加权的TF-IDF评分

我目前有一个tf-idf系统用于评分,并且我使用余弦相似度进行搜索。我想添加额外的权重,以考虑给定术语是否位于...

回答 1 投票 0

根据许多文档计算文本相似度

我正在尝试针对其他搜索字词集合计算搜索字词A的文本相似度,例如“如何制作鸡”。为了计算相似度,我使用了余弦距离和TF-IDF来...

回答 1 投票 0

可配置HTML信息提取

场景:我正在使用搜寻器提取一些HTML信息。现在,大多数提取规则都是硬编码的(不是标签或类似的东西,而是循环,嵌套元素等)。对于...

回答 1 投票 0

信息检索-如何处理将单个单词分解成多个标记的搜索查询

我只是信息检索的初学者。我正在寻求解决一个问题,即用户在输入单词时错误地在字符之间添加了一个空格,或者将两个单词合并为一个单词,从...

回答 1 投票 0

如何清除Solr中的缓存?

我正在尝试比较不同Solr查询的性能。为了获得公平的测试,我想清除查询之间的缓存。怎么做?当然,可以重新启动服务器了,我当时是...

回答 3 投票 12

Solr _ version _字段作为查询最新结果的时间戳记

我们可以使用Solr _版本_字段作为时间戳/版本,以便我们可以查询特定_版本_ / timestamp中的最新文档吗?我的要求是定期(每天)检索新的...

回答 1 投票 1

如何使用tf-idf选择停用词? (非英语语料库)

我设法评估了给定语料库的tf-idf函数。如何找到每个文档的停用词和最佳词汇?我了解给定单词和文档的低tf-idf意味着...

回答 2 投票 7

如何从文档列表中识别术语

给出可以由一个,两个或什至三个词组成的预定义术语的列表。问题在于用一组免费词汇(即,很多单词)来统计一组文档中它们的出现次数。我有...

回答 1 投票 0

如何检索使用从IMDB imdbpy特定影片ID“用户列表”

我使用IMDbPY检索“用户列表”的电影。是有可能访问“用户列表”使用IMDbPY电影吗?

回答 1 投票 0

如何使用IMDBPY检索IMDB用户评论?

是使用imdbpy可以检索IMDB用户评论?是否有另一种方式,请帮助我。

回答 1 投票 0

如何证明NDCG得分显著

假设NDCG得分为我的检索系统是0.8。我该如何解读这个分数。我如何告诉读者,这个分数是显著?

回答 3 投票 4

同义词离线词典搜索应用程序

我正在尝试构建一个智能搜索引擎应用程序,它可以获取问题和查询我的数据库中的单词的同义词,每个生成的同义词都是我正在搜索的问题...

回答 1 投票 1

尽管使用了StopAnalyzer和StopFilter,Apache Lucene也不会过滤停用词

我有一个基于Apache Lucene 5.5 / 6.0的模块,用于检索关键字。一切都很好,除了一件事 - Lucene没有过滤停止词。我尝试用...启用停用词过滤

回答 2 投票 2

如何解析Google快讯中的数据?

首先,除了解析Google发送给您的电子邮件的文本之外,您如何将Google Alerts信息发送到数据库?似乎没有Google Alerts API。如果你 ...

回答 3 投票 32

从在EAN / UPC谷歌搜索中排名第一的网站获取数据

我很好奇以下自动化是否可行:搜索谷歌搜索UCP / EAN代码(例如8710103703631)从第一个中搜索和解析数据(取决于可用的数据)...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.