如何使用Python在现有的AVRO文件中追加数据?

问题描述 投票:0回答:1

我有一个类似模式的数据框架,我需要将数据追加到AVRO文件中。我不喜欢把avro文件作为一个部分添加到文件夹中。我的AVRO文件不是作为一个部分加入到文件夹中的。请你帮我解决这个任务。

python-3.x dataframe pyspark avro spark-avro
1个回答
0
投票

你可以在写数据帧时使用模式覆盖来写数据。

但部分文件是创建的,因为火花是分布式处理,每个执行器吐出一个文件根据数据量的基础上

© www.soinside.com 2019 - 2024. All rights reserved.