将检测到的对象分类为不同的已知类别。
我想分析包含多个不同颜色的圆圈的图像,并提供图像中存在的所有彩色圆圈的计数。 以下是我正在使用的脚本和图像,但不是 ge...
我需要创建一个系统来检测从启动汽车多媒体系统到侧边栏首次出现在屏幕上之间所经过的时间。侧边栏有一个
如何使用 Google Document AI OCR 查找文本文档中的非文本图像?
如何使用 Google Document AI OCR 查找文本文档中的非文本图像? 我正在使用 Google Document AI Enterprise OCR 来 OCR 图像(旧书的扫描_,效果很好。这些书有
我想构建一个应用程序来识别壁纸上使用的表情符号。 例如,这个应用程序将接收输入: 输出时应该包含识别表情符号的名称数组...
您是否了解 Google 在语音识别中使用哪种模型,特别是有关“recognize_google”的信息? 我一直在寻找他们的文档以确定他们的型号......
我正在使用 MediaPipe 在相机图像中查找狗的品种(如果有的话)。我首先使用 ObjectDetector,如果它发现一只狗,我会将边界框内的内容发送到 ImageClassifier,wi...
导入pyautogui 进口键盘 导入时间 运行=真 print("脚本将在 5 秒后启动。") time.sleep(5) # 等待5秒再开始 在跑步的时候: 键盘。
我目前正在解释用于图像识别的经过训练的 CNN 模型。具体来说,我想了解颜色信息如何在特征向量中表示,特别是......
我有几份 PDF 格式的考试。我想以编程方式将每个问题提取为单独的图像/文档。 OCR 并不理想,因为它不能很好地维护代码/方程格式。恩...
我目前正在开展一个项目,我试图检测平坦表面(即桌子)上的一些硬币。硬币不会重叠,也不会被其他物体隐藏。但可能会有...
如何填充粒子边界中缺失的部分,使这些边界/轮廓形成连续的轮廓?
我有许多非球形粒子边界/轮廓的二元黑色粒子边界图像。不幸的是,由于图像质量较差,边界不是连续的,而是有一些间隙。有没有...
我目前正在研究图像识别,我的目标是从手机游戏的棋盘中获取如下所示的所有信息: 木板 正如你所看到的,有 5 个不同的骰子,它们的
KerasOCR、EasyOCR、Pytesseract 无法识别简单数字
我试图在我的单个字符图像上运行 OCR,所有图像都是数字。我尝试在图像上运行 EasyOCR、Keras-OCR 和 Pytesseract,但没有返回正确的输出。我什至尝试过 MNIST,但是...
使用屏幕截图对 SSH 断开连接时的 Windows 10 服务器错误进行编程
我有一个在在线托管的 Windows 10 服务器上运行的 Python 程序,它使用屏幕截图来定位特定图标。该程序使用图像识别来识别这些图标。然而,当我
我只是在我的数据集上训练了 3d Resnet50 模型(我使用的是 MSR Daily Activity 3D,它由 16 个动作组成,是一个相对较小的数据集),为了获得更好的结果,我使用...
是否可以使用 ImageMagick 等现有工具自动从漫画中提取图块,还是我应该自己编写一个工具? 我已经使用 ImageMagick 看到了答案(使用 imagemagick 我怎样才能...
对于我的学士论文,我必须制作一个识别徽标的应用程序,例如:我看到一辆车的徽标,我想知道它是什么车。我拍了一张汽车标志的照片,应用程序应该可以识别......
我正在开始一个新项目,我需要在桌面浏览器、iOS 和 Android 上运行的浏览器应用程序中进行图像识别。应使用网络摄像头或...
所以说我有很多与这些类似的图像: 我试图得到里面有数字的矩形,它是背景较浅的矩形,我也想去掉这些线条,但是
我想识别图像并从图像中提取信息。就像将摄像头指向车辆仪表板上一样,它应该检测到所有 LED 灯,并应该显示增强现实...