Telegram Bot API：语音消息音频频谱图丢失。一个错误？

Question

我正在开发一个 Telegram 机器人，我有一个关于 sendvoice API 发送语音（音频）消息的问题。

我推送一个从 MP3 源文件转换而来的 OGG 文件，使用 ffmpeg 进行转换，命令为：

$ ffmpeg -loglevel panic -i \
    /path/to/la_piattaforma_telegram_è_perfetta.mp3 \
    -c:a libopus -compression_level 10 -frame_duration 60 -vbr on -application voip \
    /path/to/la_piattaforma_telegram_è_perfetta.ogg -y

顺便说一句，MIME 类型显示正确：

$ file --mime-type -b \ 
/path/to/la_piattaforma_telegram_è_perfetta.ogg
audio/ogg

音频文件按预期正确播放，但我遇到的（小）问题是 Telegram 客户端（桌面/Android/任何）不显示“波形”（音频频谱图，如蓝色小部件中的那样）下图），波形则显示为单线。

知道如何显示波形图吗？是否需要任何特定的 OPUS 格式才能实现良好的可视化？

$ mediainfo /path/to/la_piattaforma_telegram_è_perfetta.ogg
General
Complete name                            : /path/to/la_piattaforma_telegram_è_perfetta.ogg
Format                                   : Ogg
File size                                : 5.37 KiB
Duration                                 : 2 s 79 ms
Overall bit rate                         : 21.2 kb/s

Audio
ID                                       : 1485113069 (0x588506ED)
Format                                   : Opus
Duration                                 : 2 s 79 ms
Channel(s)                               : 1 channel
Channel positions                        : Front: C
Sampling rate                            : 16.0 kHz
Compression mode                         : Lossy
Writing library                          : libopus unknown-fixed

缺乏波形可视化可能是因为音轨是单声道（1 通道）？

Answer 1

我解决了这个问题。这是我的错/错误（主要是）。我现在回答自己，分享我刚刚找到的解决方案。

Telegram SendVoice API 文档规定要发送的音频文件必须位于使用 OPUS 编码的 .OGG 文件中，
所以，正如我的问题中所述，我使用 ffmpeg 将原始（源）文件（即 .MP3）转换为 .OGG 所需的格式。
不幸的是，由于我的程序中存在错误，我发送了 MP3 原始音频而不是转换后的 OGG :(

奇怪的是，Telegram API 接受 MP3 音频格式而没有错误，但在这种情况下不显示频谱图（仅显示连续线）。

现在，通过发送正确的 .OGG 文件，我得到了预期的频谱图！

顺便说一句，Telegram API 上仍然存在一个小错误，与 API 端点文档上的规范相关（sendVoice 确实接受 ALSO .MP3 而不仅仅是 .OGG 文件）。

Answer 2

您需要考虑以下几点：

发送到 Telegram 时为您的文件指定
```
filename
```
。
直接将 MP3 文件转换为
```
.opus
```
文件。
将比特率设置为黑白 32kb 到 64kb，否则，某些 Telegram 客户端无法解码频谱图。

这应该会引导您执行如下命令：

ffmpeg -i input_path.mp3 -c:a libopus -b:a 32k -vbr on -compression_level 10 -frame_duration 60 -application voip output_path.ogg")

您可以在我的存储库中看到工作示例：

Telegram Bot API：语音消息音频频谱图丢失。一个错误？

问题描述投票：0回答：2

2个回答

最新问题

Telegram Bot API：语音消息音频频谱图丢失。一个错误？

问题描述 投票：0回答：2

2个回答

最新问题

问题描述投票：0回答：2