Tesseract - tesstrain 找不到真实的 txt 文件

问题描述 投票:0回答:1

我正在关注 tesstrain 自述文件:https://github.com/tesseract-ocr/tesstrain

当我运行

make training
时,出现以下错误:

File not found - *.gt.txt
File not found - *.gt.txt
    You are using make version: 4.4.1
Makefile:224: *** found no data/foo-ground-truth/*.gt.txt for data/foo/all-gt.  Stop.

我不明白这个错误,因为我已经三次检查了示例数据(其中包括许多 .gt.txt 文件)是否位于 data/foo-ground-truth 中。

这是到目前为止我按照自述文件所说要做的事情:

  • 我已经安装了它所说的我需要的所有内容(
    make
    wget
    find
    bash
    unzip
    bc
    )并将它们全部添加到我的路径中。
  • 我克隆了 tesstrain 存储库,创建了一个子目录 data/foo-ground-truth,并将 ocrd-testset.zip 的内容解压到其中。
  • 我跑了
    make tesseract-langdata
    。这成功地将一堆 unicharset 文件添加到 data/langdata 中。

有什么想法为什么它可能无法找到正确目录中的 .gt.txt 文件吗?我在故障排除方面遇到了困难。

我使用的是 Windows 10,Make 版本为 4.1.1。和 Python 版本 3.11.5。

makefile tesseract tesstrain
1个回答
0
投票

我找到了答案。 C:/Program Files/Git/usr/bin (包含 find.exe)需要位于 PATH 的第一个位置,我已将其添加到我的用户路径的顶部,该路径列在系统路径之后。将其添加到系统路径的顶部后,一切正常。

© www.soinside.com 2019 - 2024. All rights reserved.