Telegram Bot API:语音消息音频频谱图丢失。一个错误?

问题描述 投票:0回答:2

我正在开发一个 Telegram 机器人,我有一个关于 sendvoice API 发送语音(音频)消息的问题。

我推送一个从 MP3 源文件转换而来的 OGG 文件,使用 ffmpeg 进行转换,命令为:

$ ffmpeg -loglevel panic -i \
    /path/to/la_piattaforma_telegram_è_perfetta.mp3 \
    -c:a libopus -compression_level 10 -frame_duration 60 -vbr on -application voip \
    /path/to/la_piattaforma_telegram_è_perfetta.ogg -y

顺便说一句,MIME 类型显示正确:

$ file --mime-type -b \ 
/path/to/la_piattaforma_telegram_è_perfetta.ogg
audio/ogg

音频文件按预期正确播放,但我遇到的(小)问题是 Telegram 客户端(桌面/Android/任何)不显示“波形”(音频频谱图,如蓝色小部件中的那样)下图),波形则显示为单线。

知道如何显示波形图吗?是否需要任何特定的 OPUS 格式才能实现良好的可视化?

$ mediainfo /path/to/la_piattaforma_telegram_è_perfetta.ogg
General
Complete name                            : /path/to/la_piattaforma_telegram_è_perfetta.ogg
Format                                   : Ogg
File size                                : 5.37 KiB
Duration                                 : 2 s 79 ms
Overall bit rate                         : 21.2 kb/s

Audio
ID                                       : 1485113069 (0x588506ED)
Format                                   : Opus
Duration                                 : 2 s 79 ms
Channel(s)                               : 1 channel
Channel positions                        : Front: C
Sampling rate                            : 16.0 kHz
Compression mode                         : Lossy
Writing library                          : libopus unknown-fixed

缺乏波形可视化可能是因为音轨是单声道(1 通道)?

api bots telegram waveform ogg
2个回答
1
投票

我解决了这个问题。 这是我的错/错误(主要是)。我现在回答自己,分享我刚刚找到的解决方案。

  • Telegram SendVoice API 文档规定要发送的音频文件必须位于使用 OPUS 编码的 .OGG 文件中,

  • 所以,正如我的问题中所述,我使用 ffmpeg 将原始(源)文件(即 .MP3)转换为 .OGG 所需的格式。

  • 不幸的是,由于我的程序中存在错误,我发送了 MP3 原始音频而不是转换后的 OGG :(

奇怪的是,Telegram API 接受 MP3 音频格式而没有错误,但在这种情况下不显示频谱图(仅显示连续线)。

现在,通过发送正确的 .OGG 文件,我得到了预期的频谱图!

顺便说一句,Telegram API 上仍然存在一个小错误,与 API 端点文档上的规范相关(sendVoice 确实接受 ALSO .MP3 而不仅仅是 .OGG 文件)。


0
投票

您需要考虑以下几点:

  1. 发送到 Telegram 时为您的文件指定
    filename
  2. 直接将 MP3 文件转换为
    .opus
    文件。
  3. 将比特率设置为黑白 32kb 到 64kb,否则,某些 Telegram 客户端无法解码频谱图。

这应该会引导您执行如下命令:

ffmpeg -i input_path.mp3 -c:a libopus -b:a 32k -vbr on -compression_level 10 -frame_duration 60 -application voip output_path.ogg")

您可以在我的存储库中看到工作示例

© www.soinside.com 2019 - 2024. All rights reserved.