我如何在OCR流程中使用自定义的训练数据语言：Project Naptha Tesseract.js

Question

我有一个运行在Apache Web服务器上的http Web应用程序，最终将允许用户在图像上处理OCR。我正在使用Tesseract Naptha。我像这样包含tesseract.js CDN：

<script src='https://cdn.rawgit.com/naptha/tesseract.js/1.0.10/dist/tesseract.js'></script>

以下JavaScript代码指向我的自定义TrainingData语言（cus.traineddata.gz）的位置：

window.Tesseract = Tesseract.create({
    langPath: 'https://mydomain.co.za/path/to/traineddata_language/',
});

不，我用此代码调用识别方法：

Tesseract.recognize(image, 'cus')
        .progress(function(result){
            console.log('Status: ' + result['status']);
        })
        .then(function(result){
            console.log(result.text);
        })
        .catch(function(err){
            console.error("ERROR: " + err);
        });

但是它不起作用。引发以下错误：

加载语言'cus'失败Tesseract无法加载任何语言！如果该abort（）是意外的，请使用-s ASSERTIONS = 1进行构建，它可以提供更多信息。缓存的cus未定义

我在这里需要帮助。我该如何解决？该解决方案将仅使用我的自定义培训语言来处理图像上的OCR。

谢谢。

Answer 1

[Here是带有该库的经过定制培训的模型，可能会对您有所帮助。

我如何在OCR流程中使用自定义的训练数据语言：Project Naptha Tesseract.js

问题描述投票：0回答：1

1个回答

最新问题

我如何在OCR流程中使用自定义的训练数据语言：Project Naptha Tesseract.js

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1