所以我正在使用结构化流将一些json数据从kafka推送到Spark。以字典形式的数据具有“时间戳”字段。解析json并为每个键获取单独的列后,我注意到timestamp字段不在按顺序推送到kafka集群的顺序中,即
+----------+
| Timestamp|
+----------+
| 1 |
| 2 |
| 6 | <--
| 4 |
| 5 |
| 7 | <--
+----------+
有什么方法可以确保数据保持顺序?我能想到的一件事是在带有output_mode =“ complete”的时间戳上使用orderby。还有其他有效的选择吗?谢谢。