我有一个包含城市名称列表的输入数据文件,但是,城市名称存在拼写错误和空格字符问题。
例如:我们有汉堡,汉堡,哈堡,HAM
所以我不确定如何将它们全部分组为一个(意味着用正确的拼写重命名)?例如:以上 3 个术语都应重命名为“Hamburg”
我将其发布在这里是为了征求您的意见,是否有任何自动化方法可以将城市名称合并到适当的组中?
我在手动输入组织名称时遇到了同样的问题,只是决定构建一个工具来使用大语言模型来自动化此操作。 www.dataharmonizer.com 可以上传 CSV 并在模型可能遗漏的地方进行手动编辑。