我实际上是从 Azure Blob 存储检索音频文件,我想将它们转换回原始格式(mp3 格式)。
我正在使用
Pyspark
中的 Databricks
检索音频,如以下代码所示:
input_audio = spark.read.format("binaryFile").load("test.mp3")
input_audio
是一个PySpark Dataframe,我想将其转换为mp3。
我怎样才能实现它?谢谢!
我尝试将内容(二进制数据)写入新的
.mp3
文件,但没有成功。
我已经解决了我的问题:
首先我使用Pyspark来获取音频文件的内容
input_audio = spark.read.format("binaryFile").load("test.mp3")
# extracting audio binary content (there's several methods to extract column value)
binary_data = input_audio.collect()[0][3]
然后我刚刚将二进制数据写入一个新的 mp3 文件,如下所示:
with open('new.mp3', 'wb') as file:
file.write(binary_data)
谢谢大家!