如何使用Python从图像文件或pdf中逐行裁剪文本? [已关闭]

问题描述 投票:0回答:2

我想在图像文件或pdf文件中逐行裁剪文本图像,我使用了许多其他方法,但似乎不起作用。我想找到一个最佳解决方案。

我已经使用了许多软件包,例如 PyMuPDF、pdfplumber,并且 PyMuPDF 到目前为止运行良好。但对于图像文件,我还没有开始,因为我不知道从哪里开始。

我用它的目的:有一个名为 TrOCR 的 OCR 模型,它需要逐行文本的裁剪图像。因此,我想生成一个自定义数据集来训练该模型并对其进行微调。

python image opencv text crop
2个回答
0
投票

你可以关注这个视频(它对我有用)。 https://www.youtube.com/watch?v=nnZRBAzW3CA


-1
投票

谢谢你纠正我,蒂姆。有不同的包用于从 pdf 和图像中提取文本以供使用。您能更新一下您到底需要什么吗?

© www.soinside.com 2019 - 2024. All rights reserved.