我想在图像文件或pdf文件中逐行裁剪文本图像,我使用了许多其他方法,但似乎不起作用。我想找到一个最佳解决方案。
我已经使用了许多软件包,例如 PyMuPDF、pdfplumber,并且 PyMuPDF 到目前为止运行良好。但对于图像文件,我还没有开始,因为我不知道从哪里开始。
我用它的目的:有一个名为 TrOCR 的 OCR 模型,它需要逐行文本的裁剪图像。因此,我想生成一个自定义数据集来训练该模型并对其进行微调。
你可以关注这个视频(它对我有用)。 https://www.youtube.com/watch?v=nnZRBAzW3CA
谢谢你纠正我,蒂姆。有不同的包用于从 pdf 和图像中提取文本以供使用。您能更新一下您到底需要什么吗?