我正在使用 pytesseract 库将扫描的 pdf 转换为文本。仅当通过 pytesseract 的 image_to_string 函数单独发送 pdf 时,此方法才能正常工作。它工作正常。
问题发生在我在多线程环境中没有任何延迟地来回发送 pdf 时。我观察到 pytesseract 在这种情况下表现非常缓慢
我的问题是:有没有人遇到类似的问题并纠正了它?解决方法是什么?或者在使用这个库时我需要遵循不同的代码设计模式吗?任何帮助将不胜感激