弗林克 =
v1.14.0
CoProcessFunction
KafkaSink
下沉到 Kafka。AT_LEAST_ONCE
策略。它导致 Kafka 主题中的记录重复,因此导致进一步的数据传输/分析/whatever 不正确。KafkaSink
EXACTLY_ONCE
策略的使用不适合我们的案例。
之前从第 4 步下沉 DataStream 到 Kafka - 我决定在
forward()
上调用
DataStream<MyAwesomeObject>
方法(好吧,刚刚在源代码中找到了这个方法)
之前:
...
myDataStream.sinkTo(preConfiguredKafkaSink)
...
之后:
...
myDataStream.forward().sinkTo(preConfiguredKafkaSink)...
...
在 DataStream 上添加
forward()
调用似乎解决了问题:
在调用
forward()
之前调用sinkTo(...)
的任何缺点/优点?