Google Analytics / Google Tag Manager:合并分区数据流以进行分析的可靠和/或规范方法是什么?

问题描述 投票:0回答:1

我有大约 50 个 GA4 资源,每个资源都属于同一个 GA4 帐户。每个属性都有自己的数据流和唯一的测量 ID。这些属性正在测量同一域的各个目录,例如:

www.example.com/properties/a/
www.example.com/properties/b/
,...,
www.example.com/properties/z/

我不想解释为什么它的架构师会这样设计。只需知道分区是由供应商进行的,该供应商以这种分离促进的方式跟踪数据费用。

我现在想分析网站总流量的趋势。一些早期的想法:

  1. 创建一个
    master
    GA4 媒体资源,其中每个媒体资源都有一个网络流。 GA4 将属性限制为总共 50 个流,因此对于规模来说这不是一个好的选择 - 我们实际上已经达到了极限。
  2. 使用自己的数据流创建
    master
    GA4 媒体资源,并通过 GTM 将第二个流安装到每个网页上。这似乎有道理,并且有一些背景here(1) 和 here(2)。请注意重命名 dataLayer 的建议如何发生冲突。更糟糕的是,谷歌似乎已经从第二个链接引用的文档中删除了他们的建议。
  3. 使用自己的数据流创建
    master
    GA4 媒体资源,并使用单个 GTM 容器复制每个事件,发送到两个 GA4 媒体资源。众所周知,这会导致 cookie 问题,尽管有人这里似乎已经找到了某种使用自定义 HTML 标签的解决方法。值得注意的是,这是不受支持的,我不确定它的测试情况如何。
  4. 为此,
  5. 通过GCP 自动化流程将数据导出到 BigQuery。一旦全部完成,
    UNION
    来自每个属性的数据将创建一个用于分析的综合数据集。这有一些缺点:首先,我们如何确保在网站上的数据流之间导航的用户不会被视为合并数据集中的单独用户?我担心还有更多我没有考虑到的问题,可能与源/媒介归因指标有关。其次,但不太重要的是,这意味着前端分析需要一个新的解决方案,因为数据是从 GA4 中取出的。

目前,我正在利用 GA4 与 BigQuery 的集成进行设置,将网络事件数据自动流式传输到 BigQuery 仓库中。这似乎是我书中“最糟糕”的解决方案,因为它是官方支持的方法。然而,我还没有找到可靠的断言,即我们不会因 GA4 帐户结构而在合并数据集中出现异常情况。如果我们应该期待问题,它们可能是什么?

我希望得到一个规范的答案来解决我的根本问题。简单地重新设计帐户以在整个域中使用一个流并不是一种选择,因为我们的供应商将无法跟踪他们收取的服务费用。我应该如何获取所有属性的综合数据集进行分析?

google-bigquery google-analytics google-analytics-4
1个回答
0
投票

我同意 BigQuery 是最佳选择。您无需担心用户被多次计数,因为 user_pseudo_id 是在域范围内设置的,并且在属性之间保持相同。唯一需要考虑的是当用户在目录之间移动并更改源或介质时。为了确保准确性,您可以手动测试是否触发了 session_start 事件,或者您的新 page_view 是否有一个值为 null 的ignore_referrer 参数。如果发生其中任何一种情况,您应该在属性设置中重新考虑不需要的引荐和跨域跟踪。没有其他东西可以启动您的系统。

© www.soinside.com 2019 - 2024. All rights reserved.