我正在开发一个 Telegram 机器人,我有一个关于 sendvoice API 发送语音(音频)消息的问题。
我推送一个从 MP3 源文件转换而来的 OGG 文件,使用 ffmpeg 进行转换,命令为:
$ ffmpeg -loglevel panic -i \
/path/to/la_piattaforma_telegram_è_perfetta.mp3 \
-c:a libopus -compression_level 10 -frame_duration 60 -vbr on -application voip \
/path/to/la_piattaforma_telegram_è_perfetta.ogg -y
顺便说一句,MIME 类型显示正确:
$ file --mime-type -b \
/path/to/la_piattaforma_telegram_è_perfetta.ogg
audio/ogg
音频文件按预期正确播放,但我遇到的(小)问题是 Telegram 客户端(桌面/Android/任何)不显示“波形”(音频频谱图,如蓝色小部件中的那样)下图),波形则显示为单线。
知道如何显示波形图吗?是否需要任何特定的 OPUS 格式才能实现良好的可视化?
$ mediainfo /path/to/la_piattaforma_telegram_è_perfetta.ogg
General
Complete name : /path/to/la_piattaforma_telegram_è_perfetta.ogg
Format : Ogg
File size : 5.37 KiB
Duration : 2 s 79 ms
Overall bit rate : 21.2 kb/s
Audio
ID : 1485113069 (0x588506ED)
Format : Opus
Duration : 2 s 79 ms
Channel(s) : 1 channel
Channel positions : Front: C
Sampling rate : 16.0 kHz
Compression mode : Lossy
Writing library : libopus unknown-fixed
缺乏波形可视化可能是因为音轨是单声道(1 通道)?
我解决了这个问题。 这是我的错/错误(主要是)。我现在回答自己,分享我刚刚找到的解决方案。
Telegram SendVoice API 文档规定要发送的音频文件必须位于使用 OPUS 编码的 .OGG 文件中,
所以,正如我的问题中所述,我使用 ffmpeg 将原始(源)文件(即 .MP3)转换为 .OGG 所需的格式。
不幸的是,由于我的程序中存在错误,我发送了 MP3 原始音频而不是转换后的 OGG :(
奇怪的是,Telegram API 接受 MP3 音频格式而没有错误,但在这种情况下不显示频谱图(仅显示连续线)。
现在,通过发送正确的 .OGG 文件,我得到了预期的频谱图!
顺便说一句,Telegram API 上仍然存在一个小错误,与 API 端点文档上的规范相关(sendVoice 确实接受 ALSO .MP3 而不仅仅是 .OGG 文件)。
您需要考虑以下几点:
filename
。.opus
文件。这应该会引导您执行如下命令:
ffmpeg -i input_path.mp3 -c:a libopus -b:a 32k -vbr on -compression_level 10 -frame_duration 60 -application voip output_path.ogg")
您可以在我的存储库中看到工作示例: