我正在使用 paddleOCR 从日常使用项目中提取数据,它在大多数情况下工作正常,但有时它会将两个或多个单词混合为一个单词,它不会占用空间来执行操作 有没有更好的方法来解决这个问题
提前致谢!
尝试在2.6.1.3版本上运行并从日常家庭事务中提取英文文本,例如价格、批次号。等等
试试这个:
PaddleOCR(use_angle_cls=True, lang='en', ocr_version='PP-OCRv4', use_space_char=True)
来源:
https://github.com/PaddlePaddle/PaddleOCR/issues/5448#issuecomment-2070772509