例如:
有一个视频播放日志,格式为:user_id,video_id,play_duration,video_duration,country,request_date
我想要计算:
一个。最后一分钟的比赛次数
湾今天的比赛数量
C。在过去一小时内排名前10的最受欢迎的视频(播放时间)
d。在过去一小时内排名前10的最活跃用户(游戏时间)
在上述4个任务中,它们使用相同的源,但具有三个不同的时间窗口。是否有任何有效的解决方案来完成这些工作而无需启动3或4个工作来复制消耗。
您可以使用单个作业以4种方式拆分流,然后将其中一个窗口运算符附加到每个复制的流中。您可以使用split / select或side outputs进行拆分。