我发现流导出文档非常含糊,它没有完全详细说明一旦开始这种类型的导出我将使用哪些数据,所以我不知道会发生什么。
当由于数据大小而无法选择每日类型的导出时,剩下的就是将数据流式传输到 BigQuery 中,但流式传输除了额外成本之外,还有一些主要限制 - 流量 名称、源 和 媒介 此类导出不包含数据点,但这些是 Google Analytics(分析)中的关键数据点。
令我困惑的是上面链接页面中的这句话:
包含现有用户的用户归因数据,但该数据需要约 24 小时才能完全处理,因此我们建议不要依赖流式导出中的该数据,而是从完整的每日导出中获取用户归因数据。
任何尝试过流式导出的人都可以确认这是否意味着用户归因数据在“日内”表中不可用,但在“每日”表中可用?如果是这样,这是否意味着在这种情况下每日表每天可以收集超过 1000000 个事件?我们是否需要同时打开流媒体和每日导出才能收集这些信息?
首先,您可以在这里找到GA4导出的示例数据集。
对于大多数用例来说,每日导出就足够了,但数据收集和在 BQ 中公开数据之间存在延迟。如果您甚至需要当天的数据,您可以在盘中表中找到它。每日表每天可以导出超过 100 万个事件,但您需要 GA4 360(付费版本)。流式导出(日内)没有这个限制。
通常您不需要用户流量来源/媒介。这些用户维度只是首次访问流量来源/媒介。我假设您需要会话级流量源/介质,并且它仍然可以在日内(流媒体)导出中使用。最终你可以从那里计算出用户第一流量来源/媒介。