如何允许Google，Facebook bot爬网程序可以在AWS CloudFront上索引媒体文件？

Question

我将媒体放在AWS s3上，并设置了具有简短名称的CloudFront以获取图像资源。

Sitemap: https://example.com/sitemap.xml
User-agent: *
Disallow: /cart
User-agent: adsbot-google
Crawl-delay: 1

但是当我使用Google Search Console测试索引时，它会提醒我：允许爬网吗？ -> 否：被机器人阻止页面提取-> 失败：被robots.txt阻止

如何为CloudFront设置允许Facebook，Google bot爬虫？请帮助我解决此问题。

谢谢！

Answer 1

我和你有同样的问题。我的域名是https://asset.onyourmarkhk.com。我添加了robots.txt以允许所有操作，但Google仍显示与您相同的错误消息。