在Flink中加入历史数据时,一个源比另一个源慢得多

问题描述 投票:1回答:1

使用eventTime在连接运算符中使用历史数据时,从一个源读取数据要比另一个源慢得多。因此,连接运算符将缓存来自较快源的大量数据,以便等待较慢的源。

问题是,如何才能使消费者的速度变差?

join apache-kafka stream hdfs apache-flink
1个回答
0
投票

我不确定我明白你的意思是“......让消费者的速度差别小”。如果您想避免缓存大量数据,并且无法控制源速度,那么我认为您唯一的选择是使用较小的窗口,以便缓存较少的数据。有关详细信息,请参阅Window Join

© www.soinside.com 2019 - 2024. All rights reserved.