索引中的模糊阿拉伯语搜索

问题描述 投票:0回答:1

我尝试使用弹性搜索模糊搜索功能和阿拉伯语搜索查询。 有关它的更多详细信息在这里: https://www.elastic.co/guide/en/elasticsearch/reference/current/common-options.html#fuzziness

不幸的是,我得到的结果好坏参半。 虽然有时我确实得到了相关结果,其中包含一些错误(在这种情况下几乎所有结果都是相关的),如果没有模糊逻辑,这些错误就不会出现。 对于通常返回很少结果(少于 10 个)的错误查询,我会得到数百个不相关的查询。

有谁知道我应该如何处理这些查询,这样每当有很多噪音时,它就会被消除,而当有很多相关结果时,它们都会出现?我应该如何调整模糊度,这样才不会有害?

elasticsearch arabic fuzzy-search
1个回答
0
投票

我最近发现了这个问题,但我想回答它,因为也许现在有人需要它。

首先你想知道什么是模糊性以及它在 Elasticsearch 中是什么样子,你应该知道它在阿拉伯语中是如何工作的,因为它非常具有挑战性。在模糊性背景下,没有人可以回答你的具体问题,因为没有人会确切地知道你的数据内容是什么样的,因为它完全取决于你的实际内容,以及你对可能与你的内容相匹配的用户拼写错误的期望,并决定是否你真的需要使用模糊或其他东西吗?

在 Elasticsearch 中可能会看到不相关行为的情况下,您需要确保使用正确的查询,并始终了解您可能使用的查询属性,但不知道它将如何影响您的结果。因此,请尝试不使用其他属性的查询,然后将它们一一添加,以准确了解为什么您会看到不相关的行为。

您必须知道,有时问题不在于查询本身,而可能在于索引的映射,因此当您尝试解决问题时,请查看索引的映射,看看这是否能为您提供帮助你需要什么?另外,请确保您告诉 Elasticsearch 您使用的是阿拉伯语而不是英语,因为这可能是 Elastic 将您的内容视为英语的问题,并且肯定会给您带来不好的结果。

如果有人有任何与此主题相关的问题,请随时回复并向我提供您问题的完整详细信息。

© www.soinside.com 2019 - 2024. All rights reserved.