仅使用基于 LSTM 的模型进行 Tesseract 初始化

问题描述 投票:0回答:1

我正在尝试制作一个可以识别匈牙利语图像中的文本的应用程序。我发现匈牙利训练数据文件仅适用于基于 LSTM 的识别。我的代码是:

    AssetHelper.Init(context);
    AssetHelper.extractAssets(context);
    TessBaseAPI tessBaseAPI = new TessBaseAPI();
    tessBaseAPI.init(AssetHelper.tessDataPath, "hun");
    tessBaseAPI.setPageSegMode(TessBaseAPI.PageSegMode.PSM_SINGLE_BLOCK);
    tessBaseAPI.setImage(AssetHelper.getImageBitmap(context));
    String data = tessBaseAPI.getUTF8Text();
    dataOutput.setText(data);
    tessBaseAPI.clear();
    tessBaseAPI.end();

我正在使用:

com.rmtheis:tess-two:9.1.0

我找不到任何有关如何准确将引擎设置为 LSTM 模式的信息。我刚刚收到错误:

2024-01-23 08:02:06.221 8422-8422 Tesseract(native) hu.androidtest.ocrproject E Could not initialize Tesseract API with language=hun!

如何使引擎进入 LSTM 模式,或者如何使用匈牙利数据运行应用程序?

编辑:我尝试了训练数据的所有 3 个版本(正常、快速、最佳)。

java lstm ocr tesseract
1个回答
0
投票

最后我发现下载旧版本的训练数据是有效的。

© www.soinside.com 2019 - 2024. All rights reserved.