我训练了一个 YOLO 姿势估计模型来检测视频中的猴子。我有 20 多小时的视频片段,来自一个稳定的 2D 摄像机,笼子里关着大约 12 只猴子。检测和关键点估计工作得很好,但现在我想通过增加社交接近度来扩展研究,但我无法理解它。
但是我还找不到适合我的情况的方法。
有人可以帮助我走上正轨吗?测量猴子之间距离的最佳选择是什么? (一帧中猴子的数量范围为0到12)。
做了类似的事情,想知道你是怎么做的