模型现在只能用tf识别单个字母。如何识别连续字母的单词?
手写数字识别。 ... MNIST是用于手写数字分类任务的广泛使用的数据集。它由70,000个标记为28x28像素的手写数字灰度像素组成。该数据集分为60,000张教育图像和10,000张测试图像。
取决于图像的质量和类型,任务的难度各不相同。如果要在自然场景中进行文本检测,这将非常困难并且需要多种模型,该领域有大量研究论文。还有很多Kaggle
笔记本。这份link(不错的读物)解释了要考虑的各种因素以及为何如此困难,并分享了他的实现。
如果您尝试识别简单的二进制图像中的文本,那么这可能会帮助Separate image of text into component character images