我如何在OCR流程中使用自定义的训练数据语言:Project Naptha Tesseract.js

问题描述 投票:0回答:1

我有一个运行在Apache Web服务器上的http Web应用程序,最终将允许用户在图像上处理OCR。我正在使用Tesseract Naptha。我像这样包含tesseract.js CDN:

<script src='https://cdn.rawgit.com/naptha/tesseract.js/1.0.10/dist/tesseract.js'></script>

以下JavaScript代码指向我的自定义TrainingData语言(cus.traineddata.gz)的位置:

window.Tesseract = Tesseract.create({
    langPath: 'https://mydomain.co.za/path/to/traineddata_language/',
});

不,我用此代码调用识别方法:

Tesseract.recognize(image, 'cus')
        .progress(function(result){
            console.log('Status: ' + result['status']);
        })
        .then(function(result){
            console.log(result.text);
        })
        .catch(function(err){
            console.error("ERROR: " + err);
        });

但是它不起作用。引发以下错误:

加载语言'cus'失败Tesseract无法加载任何语言!如果该abort()是意外的,请使用-s ASSERTIONS = 1进行构建,它可以提供更多信息。缓存的cus未定义

我在这里需要帮助。我该如何解决?该解决方案将仅使用我的自定义培训语言来处理图像上的OCR。

谢谢。

javascript html cdn tesseract.js
1个回答
0
投票

[Here是带有该库的经过定制培训的模型,可能会对您有所帮助。

© www.soinside.com 2019 - 2024. All rights reserved.