使用 CNN 输入形状 - RuntimeError: shape '[32, 3, 8, 12]' 对于大小的输入无效

Question

我正在处理尺寸 = (432,288) 的 RGB 图像，这是 (3/2) 的比率，尝试使用 Conv2DTranspose（上采样）层构建生成器。

噪声向量的形状为 (32,96)，其中 96 是 (12,8) 的组合，并且与原始图像具有相同的长宽比。

我在转发功能中所做的第一步是 x = Noise.view(32,3,12,8) 但是，这是一个运行时错误，表明噪声函数中的元素数量不等于重新整形的值。如果我将通道数从 3 替换为 1，它会起作用，但我想将图像保留为 RGB 格式。请问有什么线索吗？

这是代码的非常简单的表示

import torch
noise = torch.randn(32, 96)
x = noise.view(32,3,8, 12)

错误是：

RuntimeError: shape '[32, 3, 8, 12]' is invalid for input of size 3072

谢谢你:)

Answer 1

view 是噪声变量的简单重塑张量，无论如何它都可能是 32 * 96 个值，这就是你收到错误的原因