如何防止 Google 机器人向我的混合面板发送查询?
我试图通过谷歌标签管理器排除它,但它没有用。
来自 Mixpanel 支持的 Eric。这是一个很好的问题!默认情况下,以下机器人会被 Mixpanel JavaScript 库过滤掉:
雅虎!啜饮
bingbot/2.0
谷歌机器人/2.1
百度蜘蛛/2.0
YandexBot/3.0
也就是说,可以设置一些代码来过滤掉这些用户。查找访问站点的个人的用户代理信息。在用户代理信息中的任何位置查找“bot”一词。如果您找到“bot”,请将 $ignore 属性设置为 true。
如果可以,确定机器人程序中的一种常见模式,通过过滤掉来自非面向消费者浏览器的 Web 框架的与您网站的任何交互,一次性阻止它们。例如,对于 GTM 机器人,此代码如下所示:
var userAgentBotTest = navigator.userAgent; mixpanel.register({"用户代理": userAgentBotTest}); 如果 (/(Mozilla/4.0)/i.test(userAgentBotTest)) { mixpanel.register({"$ignore": true}); }
如果你实现这段代码,你将屏蔽所有userAgent中带有“Mozilla/4.0”的userAgents。这确实包括一些较旧的浏览器,但现代浏览器(如 Chrome、Safari 和 Firefox)永远不会在其 userAgent 字符串中包含此内容。查看机器人 userAgents 和 common 机器人浏览器 的常见列表。如果这不起作用,您可以开始跟踪此 userAgent,以便您可以找到所有爬行您网站的机器人之间的共同模式。注意 $ignore 必须有一个字符串或至少设置为 true,否则事件将触发。
例如,如果我有 '$ignore': '',事件仍然会触发,因为它是一个空字符串。 '$ignore': false 也会触发该事件。 Mixpanel 数据写入一次,永远读取,这意味着一旦将数据点写入项目,就无法有选择地删除它。但是,还有其他一些选择:
希望有帮助!