是否可以将AI模型生成的字幕放回pdf文件中?

问题描述 投票:0回答:1

我有一个包含多个页面的 pdf,其中每个页面都包含文本和/或图像。我找到了从 pdf 文件中提取图像的方法,并且找到了使用 AI 模型生成图像标题的方法。但是是否可以将AI模型生成的字幕放回到pdf文件中对应的图像中呢?如果可能的话,我应该使用什么库?或者有人知道如何编码吗?预先感谢您!

python pdf artificial-intelligence text-files
1个回答
0
投票

您可以使用 PyMuPDF 将文本写入 PDF 页面......以多种方式。

注意:我是PyMuPDF的维护者和原始创建者。

您需要先找到页面上的图片位置。然后决定一个矩形(例如图像边界框的上方或下方)来接收标题文本。

例如,假设图像边界框称为

bbox
,则定义
rect = (bbox.x0, bbox.y1, bbox.x1, bbox.y1 + 20)
。这是图像下方的一个矩形,与bbox宽度相同,高度为20。

然后使用标题文本执行

page.insert_htmlbox(rect, caption)

该方法还允许您通过 HTML 样式指令对齐(例如居中)标题文本,例如

page.insert_htmlbox(rect, caption, css="* {text-align: center;}")

如果您需要更多详细信息(例如查找图像 bbox),请告诉我。

© www.soinside.com 2019 - 2024. All rights reserved.