在大型数据集中匹配关键字/字符串的算法

问题描述 投票:0回答:1

我正在编写一个程序,它给我一个标签 f.e.订单[订单类型]。为此,我使用了大量的字符串和关键字,并在输入文本中检查它们。如果它与其中一个或多个匹配,则它们返回密钥标签。

现在我正在使用很多 if/else 语句。整个代码可以用更快的语言编码,但是通过大量 if/else 语句运行文本的“慢”想法看起来效率极低。

我是怎么想的?对特定关键字进行预排序,然后检查更具体的标签,这可能会运行得稍快一些。

我认为必须有更快的实施或方法。我正在寻找一个我可以阅读更多内容的关键字/搜索词(算法问题,而不是实际的语言实现)。

我是否必须直接使用 ML 模型,或者是否有一种简单/原生的方法来实现我想要实现的目标?

    if (re.search("TEXT EXAMPLE", m_error, re.IGNORECASE) or
        re.search(".*XXXXXXXXXXX", m_error, re.IGNORECASE)):
            TAG = "IS_ORDER_TYPE_X"

输入:“我想订购 XXXX”。 输出:IS_ORDER_TYPE_X。

python algorithm sorting keyword
1个回答
0
投票

您必须考虑使用 Python 字典

当您知道确切的键名称时,查找键->值对时会更高效

© www.soinside.com 2019 - 2024. All rights reserved.