从 URL 的大型电子表格中自动发现实际营业地址

问题描述 投票:0回答:1

我正在为 10000 多家公司构建一个目录网站,并且我有一个包含公司名称和 URL 的电子表格,但我想要实际的公司地址。是否有可能自动生成的工作流程?

我为聊天 GPT 构建了提示,并进行了谷歌搜索。我希望有一种方法可以查看网站源代码以快速抓取,但我不知道。另一个想法是只抓取联系电子邮件,然后发送批量电子邮件询问地址,但我也不知道该怎么做。非常感谢任何帮助或想法。

email batch-file web-scraping street-address
1个回答
0
投票

其实不然。

无法保证企业将拥有单一的实际营业地址,他们的营业地址不仅仅是邮政信箱,他们根本不会在其网站上发布其营业地址,或者他们在其网站上发布的任何地址都将是他们的营业地址。

您可以抓取他们的网站并尝试根据

<address>
元素和模式发现地址,然后应用启发式方法来过滤它们,但结果可能与完美相去甚远。

© www.soinside.com 2019 - 2024. All rights reserved.