解码不完整的音频文件

问题描述 投票:0回答:1

我得到了一个未压缩的.wav音频文件(360 mb),似乎已被打破。该文件是使用一台小型usb录像机录制的(此刻我没有关于录像机的更多信息)。任何玩家都无法理解这一点我已经尝试过GSpot(https://www.headbands.com/gspot/)来检测它是否与wav不同,但无济于事。该文件很大,暗示它处于某种未压缩格式。它错过了文件开头的RIFF-WAVE字符,这可能表明这是其他一些格式,或者可能(在这种情况下更可能是)标题丢失。

我已经尝试将文件的字节直接转换为音频,这会产生非常嘈杂的音频文件,虽然可以制作出声音,但我能够确定采样率可能是22050hz(假设样本大小为8位)文件长度约为4小时45分钟。在Audition中通过一些过滤器运行它会导致文件在某些​​地方可以理解,但在其他地方仍然太嘈杂。

接下来,我尝试通过一些生成图像的java代码来运行数据,它显示了很多噪声,但每1024字节还有3个字节的分隔。首先是一个接近0或255(但不是100%)的字节,然后是一个表示分布在25左右(但有一些变化)的数字的字节,然后是00000000(总是100%)。第一个“块头”(我认为是这些)位于文件的513个字节处,再次接近2个幂,就像块大小一样。似乎有点过于完美的巧合,所以我提到它,因为它可能很重要。 https://imgur.com/a/sgZ0JFS,第一个图像显示1024x1024图像显示文件的第一个1mb(行方向),第二个图像显示3'块头“字节的分布。

在这些标题旁边,该文件还有清晰显示结构的区域,几乎是波浪状的结构。我想这是我追求的实际音频,但它充满了噪音:https://imgur.com/a/sgZ0JFS,第三张图片,显示了带有音频结构的文件区域。

我还为整个文件创建了一个直方图(忽略了3字节的“块头”):https://imgur.com/a/sgZ0JFS,第四个图像。我已经翻转了范围的下半部分,因为我认为音频数据应该以某个平均值为中心,但如果我错了,请纠正我。也许直方图的非对称性质与有符号/无符号数据或二进制补码有关。也许数据表示是8位浮点数或类似的东西,我不知道。

我现在碰到了一堵墙。我不知道我还能尝试什么。有没有人看到我错过的东西。也许有人可以给我一些指示,还有什么可尝试的。我真的想从这个文件中提取音频数据,因为它包含一些重要信息。

audio decode wav file-format
1个回答
0
投票

抱歉打扰了。我已经能够找到录音机的所有者并让他用它录制我一分钟的音频并将该文件发送给我。我能够确定音频是IMA 4位ADPCM编码,16位音频,48000hz。看看文件的结构我意识到简单地将好文件的标题放在坏文件的数据前应该是可能的,并且看到我再次有一个工作文件:)

我仍然非常感兴趣ADPCM是如何工作的,如果我能编写自己的解码器,那就是我再次在维基百科上漫步的另一天。祝大家有个美好的一天!

© www.soinside.com 2019 - 2024. All rights reserved.