将电话号码匹配纳入现有基于字符串的姓名匹配功能

问题描述 投票:0回答:1

我有一个 Python 函数 match_strings,它旨在匹配来自两个不同数据源的名称。这是函数定义:

蟒蛇

def match_strings(字符串1,字符串2,ngram_n = 2,阈值= 0.3):

# Function logic goes here

pass

现在,我需要扩展此功能以支持匹配来自相同数据源的电话号码。我想知道是否最好创建一个单独的电话号码匹配函数或将其合并到现有的 match_strings 函数中。

我正在考虑:

与字符串匹配相比,电话号码匹配可能需要不同的逻辑或处理。 我正在考虑使用正则表达式 (regex) 来识别和匹配电话号码。 但我希望现有的函数足够灵活,可以处理不同类型的字符串,因为现在它可以处理名称(与电话号码相比,这有点复杂)。而且还需要注意的是:id 必须使用不同的阈值,以防我必须匹配电话,因此单个函数调用可能不起作用

我应该创建一个单独的函数来进行电话号码匹配,还是可以将其合并到现有的 match_strings 函数中?如果是这样,我该如何有效地做到这一点?

我很感激任何有关在我现有的字符串匹配功能的上下文中实现电话号码匹配的最佳方法的见解或建议

python string-matching n-gram record-linkage
1个回答
0
投票

您可以使用相同的逻辑,但改变阈值并将其设置为 1,我假设电话号码需要 100% 准确度匹配,与姓名不同,并且可能添加一个虚拟参数 - match_type = 'Name /Phone',您可以根据您匹配的内容进行的函数调用而有所不同

© www.soinside.com 2019 - 2024. All rights reserved.