pointnet中输入和特征变换的区别?

问题描述 投票:1回答:1

尖点网架构

我目前正在阅读这篇论文,其中原始点云坐标正在经历两次变换,输入变换和特征变换,变换本身是由一个迷你点网,然后是一个矩阵乘法,输入变换将其变换成一个nx3向量,而特征变换则将其变换成一个nx64向量.然而这两次变换的结构本质上是一样的(tnet x matrixmultiply),那么我们怎么能说第一次变换变换的是输入,而第二次变换作用于特征呢?

deep-learning computer-vision
1个回答
2
投票

老问题了,但希望有人觉得这个答案有用,我的理解是。

两种变换都是由一个T型网组成的,它输出一个矩阵,然后再执行一个... ... 仿射变换 时乘以点云,将所有的点云对齐到同一个输入或特征空间。T-net是由PointNet分类架构中特征转换后的所有模块组成。一个共享MLP,最大池化和另一个MLP。

输入转换将所有不同的点云对齐到一个 规范空间,有效地将点云集中在原点周围,并对其进行缩放,使网络训练的所有点云都有一个标准化的大小。

然后,特征变换会执行同样的操作,现在使用的是已经使用共享MLP嵌入到特征空间的点云。这是共享MLP的关键,因为它意味着输出对给定点云中的所有点都有了解,并被嵌入到特征空间。然后,点云的64xn表示可以全部对准同一个特征空间。当共享MLP对所有的点云进行训练时,它将嵌入到一个更强大的点云的特征空间表示。

词缀 真正帮助我理解了PointNet和类似的点云架构是如何工作的,因为将点云嵌入到特征空间是非常相似的。

PointNet Architecture

© www.soinside.com 2019 - 2024. All rights reserved.