我有一个Hudi表,和一些json格式的binlog记录。现在我想将这些binlog记录合并到Hudi表中。我们知道,binlog记录需要按顺序执行。最好的方法是什么?是否应该按顺序遍历每条binlog记录,并在Hudi表中进行相应的操作?或者还有其他优雅的操作来实现这一点吗?
您可以将自定义 Spark 作业与有序处理结合使用:
您还可以使用自定义转换器检查Hudi DeltaStreamer