开源地址清除器?

问题描述 投票:11回答:5

我有一组姓名和地址,已经被输入到excel电子表格中,但问题是,许多人输入的地址是以许多不同的非标准格式输入的。 我想在将所有的地址转移到我的数据库之前,对它们进行擦洗。 找来找去,所有我真正找到的地址擦除器(解析器或格式化器)是一个由 Semaphore. 对于我的目的来说,我并不真的需要所有这些,而且我也不想为软件的许可费买单。 有没有什么免费的或开源的软件可以帮我擦洗?

database street-address
5个回答
7
投票

由于我的工作在邮寄业务... ...

一个可邮寄的地址不是地理编码。 一个允许美国邮政将邮件送到,另一个告诉你在地球上的那个点是。 美国邮政不对他们的可邮寄地址进行地理编码。这对于标记区域区域的人的目标是有用的。

你买的不是软件的许可证,你买的是数据。 邮局有很多规则,特别是当你在商业上这样做,并试图获得一个比头等舱更好的速率。请看 USPS国内邮件手册 获取完整的规则列表。 USPS一直在移动邮政编码和邮政编码之间的家庭。 公司(我工作的公司)向USPS支付其更新的邮件列表,这样我们就可以保持我们的DBs更新。 每周更新一次。

回到你的问题上。 你是想把数据改成一个通用的格式(street -> st),还是想寻找重复的数据,并且只存储真实的可邮寄地址?

对于通用格式,你可以把地址分成几块,清理空白处,并应用术语字典。 然后应用一些sql来查找重复的地址。 请记住,家庭(1 main st)和个人(john doe,1 main st)是不同的。

对于可邮寄的地址,你们中的一些人(读者)不会喜欢这个答案,但你们想要信息,而这不是免费的。 有人花时间或金钱来获取和维护这些名单。 所以,找到一种商业模式来获取列表的资金,或者去找人帮你做。数据和邮件管理

现实中。Semaphore 是很便宜的,只是要注意地址db要每季度更新一次,19元季度很便宜。

另一款地址擦洗产品。SAP PostalSoft. 不过我不知道数据的成本是多少。


4
投票

其实我在地址验证行业工作。 吉姆的答案是一个聪明的接受。不幸的是,对于我们这些预算不高的人来说,USPS的官方数据是昂贵的,系统也很复杂。(我知道的经验,因为我工作的公司。SmartyStreets,提供的地址验证费率比大多数人低)。)

我在这里能做的最好的帮助是推荐一个低成本的免费替代方案(取决于你的数量),比如LiveAddress,在那里,对于地址列表没有最低购买量,而且相对来说,API是超级便宜和超级简单的。



0
投票

我合作过的大部分软件都是非常昂贵的(或者换个角度说,市场部门很天真,预算很庞大)。

这种工作是地理编码的前奏。 这 链接维基文章 包括一个地理编码软件的列表,其中一些是免费的。 如果你幸运的话,一些免费的可能包括地址标准化例程。

如果你找到一个好的,让我知道。


0
投票

我们用的是Accuzip。它比大多数解决方案便宜很多(约700美元一年),并且每两个月更新一次。它使用USPS地址标准化API,我已经为其编写了一个.NET封装器。这让我可以实时运行它(默认情况下,Accuzip只带有批处理模式)。

© www.soinside.com 2019 - 2024. All rights reserved.