information-retrieval 相关问题

信息检索是一个研究领域,涉及从非结构化或半结构化数据集合中检索文档,信息或元数据。

MAP @ k计算

平均精度在k处计算(对于答案中的前k个元素),根据wiki,在kaggle的ml度量,这个答案:关于(平均)平均精度的混淆应该计算为平均值...

回答 1 投票 2

飞快移动邻近 搜索

我想知道,如何使用邻近搜索与飞快移动。我已经阅读了飞快移动的文档。它是通过使用类whoosh.query.Phrase(fieldname,words,...)写在文档中的。

回答 1 投票 0

语言模式通过信息检索中的嗖嗖声

我在IR工作。任何人都可以指导我,我怎样才能在嗖嗖声中实现语言模式。我已经申请了TD-IDF和BM25。我是IR新手。举个例子,最简单的语言模型......

回答 1 投票 1

余弦相似度与Okapi BM25有何不同?

我正在使用弹性搜索进行研究。我打算使用余弦相似度,但我注意到它不可用,而是我们将BM25作为默认评分函数。是否有理由......

回答 1 投票 1

爬网

我想抓取特定的东西。特别是正在发生的事件,如音乐会,电影,艺术画廊开放等等。任何可能花时间去的东西。我该如何实现......

回答 10 投票 12

多类分类器评估

我正在阅读分类器,尤其是多类分类器。我的问题是,当我使用精确度和召回来评估分类器时,我不明白假阳性的意义和......

回答 2 投票 0

如何在Lucene 5.3.x中使用BooleanQuery构建器?

我几乎是lucene的新手,并尝试和一些查询并显示它们。我已经google了整个网络,但找不到解决这个问题的正确方法。布尔查询搜索的解决方案......

回答 1 投票 10

评估python中搜索查询的结果:排名列表与一个手动标记的正确文档

给定以下预测的文档排名列表:query1_predicted = [1381,1637,646,1623,774,1764,92,12,642,463,613,...]并且这个手动标记的最佳选择:query1_manual = 646。 ..

回答 1 投票 2

用于训练具有对比损失的排名模型的批处理结构?

如果我用例如训练深度排名模型,我该如何选择我的批次。我有每个查询1个正面文件和2个负样本的对比损失?所以,它是关于排名(损失)适用于例如....

回答 1 投票 0

了解Solr函数查询性能

我在Solr中使用“edismax”和“function-query”解析器,并且很难理解“function-query”所花费的查询时间是否有意义。我正在尝试优化的查询...

回答 1 投票 1

向量空间模型 - 计算查询向量[0,0.707,0.707]

我正在阅读“信息检索简介”(Christopher Manning)这本书,当我引入查询“嫉妒的八卦”时,我被困在第6章,它表示该向量...

回答 1 投票 -1

我在哪里可以找到要导入和使用的类“org.terrier.realtime.memory.MemoryIndex”?

我正在关注快速入门指南:将搜索集成到Terrier Information Retrieval平台网站上的应用程序:Terrier IR平台主页,使用以下代码,...

回答 2 投票 0

Xapian - 除非向每个单词添加“”,否则搜索查询不会检索任何匹配项

使用C ++,我设法遵循此处的Xapian教程。 https://getting-started-with-xapian.readthedocs.io/en/latest/practical_example/index.html#索引器程序按我的预期工作...

回答 1 投票 0

Google引擎是否会惩罚包含(机器或人工)翻译内容的网页?

Google SE对重复内容和旋转内容采取零容忍政策,但我不确定它是如何处理翻译文本的?有关它如何检测翻译内容的任何猜测?第一件事 ...

回答 1 投票 0

以json格式使用tweepy保存推文

我们如何使用json格式的tweepy收集推文并保存到本地磁盘。我需要在Solr中输入json文件以进行索引和标记化。这是我正在使用的代码:`import json ...

回答 1 投票 0

使用qr代码将信息存储在数据库中

我是QR码的新手,想知道QR码是否可以将值存储到数据库中?例如,如果收据打印出QR码,公司可以扫描收据的QR ...

回答 4 投票 4

具有相同单词root / stem的单词可以被视为同义词吗?

基本上,具有相同词根/词干的两个单词是否可以被视为同义词,特别是在搜索引擎/信息检索上下文中使用时?

回答 3 投票 1

关键词 - 在信息检索系统中搜索同义词

我开发了一个chatbot来为用户输入提供正确的答案。现在,我正在努力解决如何正确读取数据库/知识库或只是json文件以提取正确答案。在我的用例中我......

回答 1 投票 0

使用python 3.5.0在Windows 8上提取Pdf的文本

我想在windows8的slate包的帮助下使用python 3.5.0从Pdf文件中提取文本。问题:虽然我在尝试导入时仍然成功安装了slate包...

回答 3 投票 3

从firebase android检索用户信息时遇到问题

Profile Fragment Code public View onCreateView(LayoutInflater inflater,ViewGroup container,Bundle savedInstanceState){查看rootView = inflater.inflate(R.layout ....

回答 1 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.