如何修复数据中的拼写错误?

问题描述 投票:0回答:1

我有一个包含城市名称列表的输入数据文件,但是,城市名称存在拼写错误和空格字符问题。

例如:我们有汉堡,汉堡,哈堡,HAM

所以我不确定如何将它们全部分组为一个(意味着用正确的拼写重命名)?例如:以上 3 个术语都应重命名为“Hamburg”

我将其发布在这里是为了征求您的意见,是否有任何自动化方法可以将城市名称合并到适当的组中?

database data-analysis data-cleaning
1个回答
0
投票

我在手动输入组织名称时遇到了同样的问题,只是决定构建一个工具来使用大语言模型来自动化此操作。 www.dataharmonizer.com 可以上传 CSV 并在模型可能遗漏的地方进行手动编辑。

© www.soinside.com 2019 - 2024. All rights reserved.