我有一份 Azure 流分析工作。我想让它每 15 分钟处理一次输出

问题描述 投票:0回答:1

我从事件中心获取一些事件并将它们保存在 ADLS Gen 2 中,而不执行任何操作。只是在 ADLS Gen 2 中保存实时事件。 我不做任何类型的求和、平均或过滤。 我希望我的工作每 15 分钟更新一次我的 blob。 就像它不应该在事件发生后立即处理事件一样,它应该按照 15 分钟的周期保存,然后处理事件。 我希望输出每 15 分钟更新一次。

我从事件中心获取一些事件并将它们保存在 ADLS Gen 2 中,而不执行任何操作。只是在 ADLS Gen 2 中保存实时事件。

我没有进行任何类型的求和、平均或过滤。

我希望我的工作每 15 分钟更新一次我的 blob。

就像它不应该在事件发生后立即处理事件一样,它应该按照 15 分钟的周期保存,然后处理事件。

我希望输出每 15 分钟更新一次。

azure stream analytics azure-stream-analytics data-engineering
1个回答
0
投票

查看输出配置。您可以使用最小行数和最大时间之间的组合来满足您的需求。

最少行数:

每批的最小行数。对于 Parquet,每个批次都会创建一个新文件。当前默认值为 2,000 行,允许的最大值为 10,000 行。

最长时间

每批次的最大等待时间。此后,即使未满足最小行数要求,该批次也会写入输出。当前默认值为 1 分钟,允许的最大值为 2 小时。如果您的 blob 输出具有路径模式频率,则等待时间不能高于分区时间范围。

有一个快速入门,向您展示如何使用 Visual Studio Code 的 ASA Tools 扩展配置输出。

© www.soinside.com 2019 - 2024. All rights reserved.