未找到Tesseract unicharset_extractor命令

问题描述 投票:2回答:1

我的问题

运行unicharset_extractor并接收:

unicharset_extractor:找不到命令

我的环境

OSX El Capitan Version 10.11.4

Terminal Version 2.6.1 (361.1)

tesseract 3.04.00
 leptonica-1.73
  libgif 4.2.3 : libjpeg 9a : libpng 1.6.21 : libtiff 4.0.6 : zlib 1.2.8 : libwebp 0.5.0 : libopenjp2 2.1.0

类似的问题

这个问题已经被问了很多,但似乎没有解决我的问题。这里列出了一些非工作问题:

unicharset_extractor: command not found

Adding New Fonts to Tesseract 3

Issue 1327 in tesseract-ocr: unicharset_extractor statement doesn´t work

我在做什么

我目前正在尝试训练我的tesseract-ocr识别自定义数字。

我做了什么

我最初使用tesseract安装了Homebrew,它将tesseractleptonica和其他依赖项安装到/usr/local/Cellar。我使用this指南来帮助我训练数据。像导游指示的那样,我首先以.tif的格式生成了一组tla.test_font.exp[num].tif文件。然后我使用这个脚本生成了.box文件:

for i in `seq 0 52`;
do
    tesseract tla.test_font.exp$i.tif tla.test_font.exp$i -l eng -psm 10 batch.nochop makebox
done

然后我通过tesseract运行.box文件:

for i in `seq 0 52`;
do
    tesseract tla.test_font.exp$i.tif tla.test_font.exp$i -l eng -psm 10 nobatch box.train
done

然后我尝试运行unicharset_extractor *.box,我收到上面的错误消息。

怀疑它与我的tesseract安装路径有关,并且不想使用符号链接更加混乱,然后我从tesseract卸载libtoolleptonicausr/local/Cellar,并使用MacPorts再次安装所有内容。这次是在/opt/local/bin。在重复上述相同的步骤后,我陷入了同样的问题。我甚至试过运行man unicharset_extractor并且手册页工作得很好。

bash path tesseract osx-elcapitan image-recognition
1个回答
2
投票

安装tesseract时,您尚未安装培训工具。现在,您必须使用以下命令brew uninstall tesseract卸载tesseract,然后使用brew install安装工具--with-training-tools tesseract

在此之后,您应该能够运行unicharset_extractor命令。

谢谢

© www.soinside.com 2019 - 2024. All rights reserved.