针对字符串标记列表搜索字符串的算法

问题描述 投票:-1回答:1

我目前正在尝试实现一种搜索算法,其中用户将输入一个字符串查询,该查询将与包含字符串“标签”列表的对象进行比较,或者仅与单个字符串进行比较。我希望结果是按列表排序的对象列表,该列表与此查询最匹配。

我目前的实现是在每个标签上使用Levenshtein Distance与查询,将其添加到总计,并除以标签的数量。然而,我对这种方法有许多不利因素,并且想知道是否有更常见的方法来解决这个问题。

string algorithm search tags string-comparison
1个回答
0
投票

我认为这是类似的。 How to extract keywords (tags) from text

你的查询多久了?

对于小型查询文本,您可以访问

https://towardsdatascience.com/extracting-keywords-from-short-text-fce39157166b

我不认为Levenshtein Distance是生成令牌的非常有效的方法。它基于匹配的字符串未命中,但是从查询中您可能想知道代表查询意图的关键字,然后从您的标签列表中检查,这完全适合它。

您可以使用许多可用的库,例如nltk,apache open nlp等用于您的目的。他们直接生成令牌。

这可能对你有帮助。 How to extract keywords (tags) from text

© www.soinside.com 2019 - 2024. All rights reserved.