为了将原始环境声音文件内容与元数据和评估日期保存在一起,声音数据将作为原始声音文件的原始字节到字节流(uint8 数组)复制到 HDF5 文件的数据集中。因此,每次都可以完整地再现原始文件。当然,数据集不仅包含编码的PCM数据,还包含围绕这些数据的原始文件的分帧。就我而言,原始文件是作品文件。但它也可以是 mp3 或任何其他格式。没有用于解码的 HDF5 插件。所以我必须在 HDF5 数据访问之外进行。
为了在不同的评估例程中使用数据,我正在寻找一种通用的解决方案来将 HDF5 数据集中的字节作为文件对象进行访问。因此,如果是 opus 文件,我可以通过 pyogg.opus_file_stream.OpusFileStream(filepath) 绑定数据集。或任何其他库,如 librosa。
弗兰克
我的解决方案是,将数据解压到一个临时文件中并使用它。但是是否有可能将 HDF5 数据集解释为没有任何数据副本的文件?