我有一个运行在Apache Web服务器上的http Web应用程序,最终将允许用户在图像上处理OCR。我正在使用Tesseract Naptha。我像这样包含tesseract.js CDN:
<script src='https://cdn.rawgit.com/naptha/tesseract.js/1.0.10/dist/tesseract.js'></script>
以下JavaScript代码指向我的自定义TrainingData语言(cus.traineddata.gz)的位置:
window.Tesseract = Tesseract.create({
langPath: 'https://mydomain.co.za/path/to/traineddata_language/',
});
不,我用此代码调用识别方法:
Tesseract.recognize(image, 'cus')
.progress(function(result){
console.log('Status: ' + result['status']);
})
.then(function(result){
console.log(result.text);
})
.catch(function(err){
console.error("ERROR: " + err);
});
但是它不起作用。引发以下错误:
加载语言'cus'失败Tesseract无法加载任何语言!如果该abort()是意外的,请使用-s ASSERTIONS = 1进行构建,它可以提供更多信息。缓存的cus未定义
我在这里需要帮助。我该如何解决?该解决方案将仅使用我的自定义培训语言来处理图像上的OCR。
谢谢。
[Here是带有该库的经过定制培训的模型,可能会对您有所帮助。