我有一个类似模式的数据框架,我需要将数据追加到AVRO文件中。我不喜欢把avro文件作为一个部分添加到文件夹中。我的AVRO文件不是作为一个部分加入到文件夹中的。请你帮我解决这个任务。
你可以在写数据帧时使用模式覆盖来写数据。
但部分文件是创建的,因为火花是分布式处理,每个执行器吐出一个文件根据数据量的基础上