具有不同输入形状的神经网络

问题描述 投票:0回答:1

我目前正在设计用于灰度图像着色的神经网络架构。稍后它应该能够着色具有不同尺寸和不同宽高比的图像。我读到这对于普通的CNN是不可能的。我还读到,唯一的选择是将图像缩小到一个特定大小或使用大的固定大小(如3000x3000px)并将剩余空间填充为黑色。这两个选项似乎都不那么优雅。第一个与我想要的相反,第二个会使神经网络变慢。

然后我读到有关完全卷积网络的问题,并且那里不存在这个问题。如果确实有效,这将是很好的。我想知道为什么这个特殊网络可以处理不同的输入形状。也许你可以给我看一些这样一个网络的张量流代码。

顺便说一下,我想到了一个自动编码器和一个用于架构的GAN。

python tensorflow machine-learning deep-learning computer-vision
1个回答
0
投票

根据我的经验,您无法在同一批次上训练任何具有不同样本大小的网络。

完全卷积网络类似于完全连接的网络,最终具有完全连接的层。因此,批次中的任何输入图像必须具有相同的调光(w,h,d)。

不同之处在于,完全连接的层为输入批次中的每个样本输出单个输出向量,而完全卷积网络输出每个类的概率图。

它具有比图像大小更深的含义,当试图拟合任何数据时,它的大小必须是绝对的,并且在训练时不能改变。我想你可以按照我说的不同批次进行,但我从未尝试过。

编码器\解码器可以帮助“重建”特定大小的图像。

这个提示再次来自我在物体检测方面的经验,我可能是错的:)

© www.soinside.com 2019 - 2024. All rights reserved.