我正在为 10000 多家公司构建一个目录网站,并且我有一个包含公司名称和 URL 的电子表格,但我想要实际的公司地址。是否有可能自动生成的工作流程?
我为聊天 GPT 构建了提示,并进行了谷歌搜索。我希望有一种方法可以查看网站源代码以快速抓取,但我不知道。另一个想法是只抓取联系电子邮件,然后发送批量电子邮件询问地址,但我也不知道该怎么做。非常感谢任何帮助或想法。
其实不然。
无法保证企业将拥有单一的实际营业地址,他们的营业地址不仅仅是邮政信箱,他们根本不会在其网站上发布其营业地址,或者他们在其网站上发布的任何地址都将是他们的营业地址。
您可以抓取他们的网站并尝试根据
<address>
元素和模式发现地址,然后应用启发式方法来过滤它们,但结果可能与完美相去甚远。