如何使用TextCleaner处理带有深色背景的浅色文本

问题描述 投票:1回答:1

正如标题所指出的那样,我收集的大多数图像都有深色背景和浅色单词,这使得tesseract很难识别嵌入的文本。任何人都知道如何用TextCleaner交换两种颜色?谢谢!

imagemagick ocr
1个回答
2
投票

在我的textcleaner脚本中没有这个标志。但我会尝试添加一个。现在你可以通过将-negate ImageMagick命令输入到脚本中来实现:

convert input -negate miff:- | textcleaner -f 20 -o 10 - output

编辑:我刚刚发布了另一个版本的脚本,允许一次或两次反转。所以上面的例子就是

textcleaner -f 20 -o 10 -i 1 input output

其中-i 1表示反转输入的颜色。如果要反转颜色,则处理然后再次反转输出,然后使用-i 2。

请注意,如果您使用textcleaner进行商业用途,请与我联系以获取许可。

© www.soinside.com 2019 - 2024. All rights reserved.