几乎是标题。使用NLP,我想要一些可以从图像中提取文本的东西。我对此并不陌生,不知道从哪里开始以及如何去做。帮助将不胜感激。
您要创建它还是使用已知的API?有两种众所周知的选择,即Google视觉或tesseract。在tesseract中,阿拉伯语的标记为'ara'-> https://raw.githubusercontent.com/tesseract-ocr/tessdata_best/master/ara.traineddata。在Google视野中是languageHints ='ar'