具有不同输入形状的神经网络

问题描述投票：0回答：1

我目前正在设计用于灰度图像着色的神经网络架构。稍后它应该能够着色具有不同尺寸和不同宽高比的图像。我读到这对于普通的CNN是不可能的。我还读到，唯一的选择是将图像缩小到一个特定大小或使用大的固定大小（如3000x3000px）并将剩余空间填充为黑色。这两个选项似乎都不那么优雅。第一个与我想要的相反，第二个会使神经网络变慢。

然后我读到有关完全卷积网络的问题，并且那里不存在这个问题。如果确实有效，这将是很好的。我想知道为什么这个特殊网络可以处理不同的输入形状。也许你可以给我看一些这样一个网络的张量流代码。

顺便说一下，我想到了一个自动编码器和一个用于架构的GAN。

python

tensorflow

machine-learning

deep-learning

computer-vision

1个回答

0
投票

根据我的经验，您无法在同一批次上训练任何具有不同样本大小的网络。

完全卷积网络类似于完全连接的网络，最终具有完全连接的层。因此，批次中的任何输入图像必须具有相同的调光（w，h，d）。

不同之处在于，完全连接的层为输入批次中的每个样本输出单个输出向量，而完全卷积网络输出每个类的概率图。

它具有比图像大小更深的含义，当试图拟合任何数据时，它的大小必须是绝对的，并且在训练时不能改变。我想你可以按照我说的不同批次进行，但我从未尝试过。

编码器\解码器可以帮助“重建”特定大小的图像。

这个提示再次来自我在物体检测方面的经验，我可能是错的:)

具有不同输入形状的神经网络

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1