将此标记用于与计算机视觉相关的问题 - 软件的任何方面,使计算机能够使用相机感知,理解和响应其环境。有关图像过滤和量化的问题,请使用标签[image-processing]。
我正在尝试在 OpenCV 中使用 StereoBM 从一对图像中提取视差图。忽略下面视差图的质量不好,你可以看到它的上面有很多黑色的柱子......
我正在寻找将蒙版(高度 x 宽度布尔图像)转换为一系列边界框的方法(请参见下面的示例图片,我手绘),其中框包围着“tr.. .
在 python/OpenCV 中使用图像文件作为参考来检测 GUI 按钮的最佳方法
我正在挑战自己,让玩一款名为 Pokemon TCG Online 的游戏自动化。 由于我对逆向工程一无所知,我正在尝试使用计算机视觉来识别对象并且
我想要一个Python脚本将洋葱图像的背景更改为黑色,该怎么做?
我正在尝试将洋葱图像的背景颜色更改为黑色 我尝试使用 opencv 和 Pixellib 在 python 中编写代码,但它不起作用,我期待一些帮助来改变这个
有两个坐标系。我们知道原点的 3D 坐标以及第二坐标系相对于第一坐标系的轴的 3D 向量。那我们该怎么办呢
这是我的第一个计算机视觉项目,我仍然了解基础知识。我正在使用 Kaggle 的水分割数据集,并尝试使用 1888 个图像训练模型。我想表演
数据增强无疑是一种很好的正则化方法,它提高了我在未见过的测试集上的准确性。但是我不明白为什么会降低网络的收敛速度?我知道
我正在尝试为这张图片找到一个角落。这个角对我来说似乎足够清晰,但由于某种原因,该算法似乎没有得到正确的结果。 我一直在使用可用的旋钮(termi...
我正在尝试从 2 个图像实现 3D 重建。我遵循的步骤是, 1. 使用SURF找到2张图像之间的对应点。 2.实施八点算法来找到“基本矩阵...
我想在图像的特定区域应用凸起效果,例如使眼睛变大或使用Python的Photoshop液化滤镜的膨胀效果。像这样: https://imgur.com/nBswbO2 这...
我有点困惑为什么特征点的坐标是浮点数而不是整数。由于所有像素都是整数,所以有一个浮点特征点不是很奇怪吗? 谢谢你! 对于
我一直遇到这个错误并且无法修复它。我和很多人交谈过,他们不知道该怎么办。我的代码如下。这是非常简单的代码,应该打开我的网络摄像头并显示实时视频
Python:scikit-image 库中的ski.transform.warp 无法按预期工作
我最近开始尝试一些图像处理,并且对该领域相对较新。 我不明白为什么在使用 python scikit 中的以下代码时会得到意想不到的结果......
我正在尝试做的事情: 合并这两个图像: 和这个: 使用此面膜: 创建此输出: 编写一个程序来创建带有蒙版的两个图像的合成图像, 基于图像
我使用YOLOv8X进行照片中的物体检测,最近我一直在想图像大小对检测质量的影响。我通常使用 Roboflow 中的数据集并将大小调整为 1280x1...
如何使用python将.pickle或.dat文件转换为.tflite?
我有 .pickle 文件,它由面部编码数组组成,现在我想将其转换为 .tflite 扩展文件。我该怎么做? 提前致谢!回答将不胜感激
我目前正在将图像传递给背景去除模型(类似于rembg),结果总体令人满意。我唯一的抱怨是该模型有时在某些方面过于激进
我正在尝试实现立方形状(k,k)的2D滑动窗口,以便我可以迭代帧(n,m,3)并计算每个窗口中像素值的平均值。 我想要每次迭代,
如何解决 **AttributeError: 'NoneType' object has no attribute 'copy'**
这是我的代码 **导入CV2 导入线程 从 DeepFace 导入 DeepFace 上限 = cv2.VideoCapture(0,cv2.CAP_DSHOW) cap.set(cv2.CAP_PROP_FRAME_WIDTH,640) cap.set(cv2.CAP_PROP_FRAME_HEIGHT,480) 国家...
所以我正在使用来自kaggle的deepfake检测数据集,我的模型似乎过度拟合,大约有2000张图像,其中1k用于“真实”类,1k用于“假”类。所有图像都是面孔。我正在使用