我如何像Google一样抓取社交媒体网站? Google是否使用每个特定于站点的API或非特定站点的爬网?

问题描述 投票:1回答:1

我如何像Google一样抓取社交媒体网站? Google是否使用每个特定于站点的API提取站点内容或非特定站点的爬网?

web-crawler google-crawlers
1个回答
1
投票

AFAIK,他们为此使用了正式协议或API。我相信他们在几年前(this came up时)与Twitter达成了一项特殊协议,但我不确定这种事情是否已经存在。

[如果看到Facebook's robots.txt,您会注意到它们有一些阻止程序,因此我相信Google会像其他任何网站一样对它们进行爬网。

并不是说网站所有者对他们的Googlebot没有特殊待遇。如果您想看到类似Googlebot的页面,请使用Mobile Friendly Testing tool

© www.soinside.com 2019 - 2024. All rights reserved.