在查看 CloudFront 日志时,我的照片服务 CDN 最常见的引荐来源网址是
Not Specified
。我正在尝试更多地了解为什么会这样,以及请求可能来自哪里。
我们正在为照片服务 CDN 存储 cloudFront 日志。客户要求知道他们的数据费用的确切来源。我能够通过 Athena 运行一份报告,告诉我们每个唯一的推荐人以及他们在上个月交付的数据量。
就字节而言,排名第二的最昂贵的引荐来源网址是
-
。我相信 CloudFront 称此引荐来源网址为Not specified
,并且在检查 CloudFront 时,它是我们在请求计数方面排名第一的引荐来源网址。
我假设用户不会以这种速度直接访问这些网址。
我对此有几个问题。
是否有任何方法可以获取有关这些特定请求的来源的更多信息?
是否有不提供引荐来源网址的常见已知来源?我误解了推荐人在这里的意思吗?
这是一个坏兆头吗?
是否有不提供引荐来源网址的常见已知来源?我误解了推荐人在这里的意思吗?
我会从这里开始,因为这很重要......
referer
(RFC 使用此拼写错误)仅表示资源是从链接访问的,例如锚点或 img
标记。在许多情况下不会有 referer
标头,包括当网站指定 referrer-policy 指示浏览器在检索资源或打开链接时不要发送 referer
标头。
您无法控制
referer
是否会被其他网站发送。直接访问资源时也可以省略头部。如果您允许 POST
请求访问内容,这也可能导致标头丢失。
这是一个坏兆头吗?
如果您所说的“坏迹象”是指恶意行为者的迹象,则不一定。如果“不好的迹象”意味着您无法为您的网站提供强大而完整的分析,是的。
有什么方法可以获取有关这些特定请求的来源的更多信息?
如果有,您可以反向查找/地理定位源 IP 地址。另请参阅用于确定查看者位置的标题。