如何根据内容将成绩单分成章节?

问题描述 投票:0回答:0

我想根据每句台词的内容将一段视频抄本分成几章。抄本将用于为每一章生成一系列开始和结束时间戳。这类似于 YouTube 现在“自动分章节”视频的方式。

.srt 成绩单示例:

...

70
00:02:53,640 --> 00:02:54,760
All right, coming in at number five,

71
00:02:54,760 --> 00:02:57,640
we have another habit that saves me around 15 minutes a day
...

我在使用 ChatGPT 时运气不佳,因为它发现很难同时按主题分段并准确地重新收集开始和结束时间戳。我现在正在探索是否还有其他选择。

我知道一些 python 库可以基于时间序列进行主题建模。我还阅读了有关文本平铺作为另一种选择的信息。 有什么选择可以实现这样的结果?

注意:以上格式(.srt)不是必须的。这只是输入是带有开始和结束时间戳的文本内容列表的想法。

machine-learning nlp topic-modeling openai-api
© www.soinside.com 2019 - 2024. All rights reserved.