我有流拓扑,从2个主题读取,重新分区,然后使用2天的joinWindow连接它们。
我的问题是kafka流状态存储似乎导致非常小的文件的读取和写入导致我的流线程卡在IO等待中,因此我的性能确实滞后。
任何表现建议?
尝试使用SSD磁盘,还是?
更长的评论 - 由于Kafka被编程为健壮,因此每个消息都存储在磁盘上,因此非常密集IO。
顺便说一下,数字对你来说意味着什么“落后”?关于你在说什么吞吐量?