vision 相关问题

使用数学方法获取,分析和理解图像的方法。

VNRecognizeTextRequest 数字/七段数字

我基本上遵循了 VNRecognizeTextRequest 上这个很棒的教程并修改了一些内容: https://bendodson.com/weblog/2019/06/11/detecting-text-with-vnrecognizetextrequest-in-ios-13/ 我正在尝试...

回答 1 投票 0

SwiftUI Vision Pro 窗口宽度可以动态设置吗?

我尝试使用像视图这样的框架: @主要的 结构 i2ElevatorApp:应用程序 { private var PortraitSize : CGSize = CGSize(宽度: 400, 高度: 600) 私有变量景观大小:CGSize = CGSize(宽度:600,

回答 1 投票 0

在 ASP.NET Core 中使用 ChatGPT4 Vision

我正在开发一个与 openai 集成的 Web 应用程序。我已实现标准聊天提示和响应,但在访问视觉 API 时遇到问题。我能找到的所有例子......

回答 1 投票 0

在 ASP.Net 中使用 ChatGPT4 Vision

我正在开发一个与 openai 集成的 Web 应用程序。我已实现标准聊天提示和响应,但在访问视觉 API 时遇到问题。我能找到的所有例子......

回答 1 投票 0

SwiftUI - 如何识别单词并在 Vision 中获取位置

下面的代码只能识别单词,但我不知道如何获取位置。 我可以获取文本,但不能获取边界框。 来自:https://medium.com/@jakir/text-recognition-or-ocr-using-vision-

回答 1 投票 0

Swift iOS - Vision 不会从 cgImage 返回任何观察结果

我正在尝试编写一个应用程序,允许用户跟踪日语字符,然后该应用程序将使用 Vision 来确定它们是否已被正确跟踪。为了测试这一点,我正在尝试......

回答 1 投票 0

Swift 中图像中的文本识别

我是 Swift 新手,我试图制作一个可以解析屏幕截图上的应用程序。到目前为止,我有以下代码,但我无法找到调用识别函数的正确方法...

回答 1 投票 0

原深感相机像素距离不准确

我利用前置原深感摄像头与 Vision 相结合来识别图像中的点并运行一些测量。我知道视觉坐标已标准化,所以我转换...

回答 1 投票 0

为什么 timm 视觉变压器位置嵌入初始化为零?

我正在研究视觉转换器的 timm 实现,对于位置嵌入,他正在用零初始化他的位置嵌入,如下所示: self.pos_embed = nn.Parameter(火炬....

回答 2 投票 0

使用拥抱脸和 ViT 无法加载灰度图像

我有一个灰度格式的图像数据集。现在我想使用视觉变压器和拥抱脸对其进行分类。数据集位于谷歌驱动器中,但问题是我无法读取图像。

回答 1 投票 0

Apple Vision API 的实时预览

我正在尝试编写一个 iOS 应用程序,它可以扫描文档以使用 Apple 的 Vision API 进行处理。目标是让实时视频源显示摄像机在屏幕上看到的内容,以及......

回答 1 投票 0

Swift - 将 TrueDepth 点云数据导出到 .PLY 和 SceneKit

因此,我尝试转换来自 TrueDepth 相机示例的 Apple 流深度数据给出的深度数据。问题是,当我尝试将深度和颜色数据导出为 .PLY 格式时,我得到

回答 1 投票 0

从视觉框架获取连续的头部姿势信息

我正在尝试从 macOS (Ventura) 上的 Vision.framework 进行头部跟踪期间获取头部姿势信息。我能够在第一帧上获取它,但不确定随后如何获取它。我正在创造...

回答 1 投票 0

如何在 Flutter 应用程序中使用 google Vision API

我想创建一个应用程序(由Flutter构建),它使用谷歌云视觉(https://cloud.google.com/vision/)的OCR功能。在应用程序中,用相机拍照,并使用谷歌云视觉

回答 1 投票 0

运行时错误:排列(sparse_coo):张量输入中的维度数与所需维度排序的长度不匹配

所以,我使用这个剪辑模型来执行一些标签任务。但是当我使用剪辑模型的文本编码器时,它会出现以下错误: 前进(自我,批量...

回答 1 投票 0

如何将 scikit-image 中的巴特沃斯滤波中的 cutoff_Frequency_ratio 转换为 Cycles/Pixel

我正在使用 skimage.filters 中的巴特沃斯过滤器函数,详细信息请参见此处的源代码。我的主要目标是了解 cutoff_Frequency_ratio 参数之间的关系...

回答 1 投票 0

使用 VNRecognizeTextRequest 进行垂直文本识别

在对 iOS 应用程序(用 Swift 5 编写)进行一些测试期间,我发现使用 VNRecognizeTextRequest 识别垂直书写的文本存在问题。我还检查了可修改的参数...

回答 1 投票 0

在 OpenCV 中检索当前帧编号

如何使用 OpenCV 检索视频的当前帧号? OpenCV 是否有任何内置函数来获取当前帧还是我必须手动执行?

回答 4 投票 0

使用 DataScannerViewController 启用/禁用手电筒

在iOS16上,我尝试使用DataScannerViewController(用于条形码读取)来用Vision替换旧方法,但是当我启用手电筒时,DataScannerViewController冻结了...... 启用/d 的代码...

回答 1 投票 0

YOLOv5中指标的含义

YOLOv5 中的指标“mAP_0.5”意味着什么? 如果我们进行了 N 次迭代并且其值是恒定的,这意味着什么? 最后,训练损失指标是什么,“盒子损失”和......

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.