如何防止 Google 机器人向我的混合面板发送查询?

问题描述 投票:0回答:2

如何防止 Google 机器人向我的混合面板发送查询?

我试图通过谷歌标签管理器排除它,但它没有用。

google-tag-manager mixpanel
2个回答
0
投票

Mixpanel JS 脚本默认过滤掉主要的搜索机器人。

对于其他机器人,您可以添加一个脚本来查看 UserAgent 并过滤掉您不感兴趣的那些。

阅读更多信息Mixpanel thread.


0
投票

来自 Mixpanel 支持的 Eric。这是一个很好的问题!默认情况下,以下机器人会被 Mixpanel JavaScript 库过滤掉:

雅虎!啜饮

bingbot/2.0

谷歌机器人/2.1

百度蜘蛛/2.0

YandexBot/3.0

也就是说,可以设置一些代码来过滤掉这些用户。查找访问站点的个人的用户代理信息。在用户代理信息中的任何位置查找“bot”一词。如果您找到“bot”,请将 $ignore 属性设置为 true。

如果可以,确定机器人程序中的一种常见模式,通过过滤掉来自非面向消费者浏览器的 Web 框架的与您网站的任何交互,一次性阻止它们。例如,对于 GTM 机器人,此代码如下所示:

var userAgentBotTest = navigator.userAgent; mixpanel.register({"用户代理": userAgentBotTest}); 如果 (/(Mozilla/4.0)/i.test(userAgentBotTest)) { mixpanel.register({"$ignore": true}); }

如果你实现这段代码,你将屏蔽所有userAgent中带有“Mozilla/4.0”的userAgents。这确实包括一些较旧的浏览器,但现代浏览器(如 Chrome、Safari 和 Firefox)永远不会在其 userAgent 字符串中包含此内容。查看机器人 userAgentscommon 机器人浏览器 的常见列表。如果这不起作用,您可以开始跟踪此 userAgent,以便您可以找到所有爬行您网站的机器人之间的共同模式。注意 $ignore 必须有一个字符串或至少设置为 true,否则事件将触发。

例如,如果我有 '$ignore': '',事件仍然会触发,因为它是一个空字符串。 '$ignore': false 也会触发该事件。 Mixpanel 数据写入一次,永远读取,这意味着一旦将数据点写入项目,就无法有选择地删除它。但是,还有其他一些选择:

  1. 从 UI 中隐藏有问题的事件
  2. 如果机器人活动具有可区分的属性值,则创建一个 Custom Event 排除具有该值的所有活动。

希望有帮助!

© www.soinside.com 2019 - 2024. All rights reserved.