我正在处理尺寸 = (432,288) 的 RGB 图像,这是 (3/2) 的比率,尝试使用 Conv2DTranspose(上采样)层构建生成器。
噪声向量的形状为 (32,96),其中 96 是 (12,8) 的组合,并且与原始图像具有相同的长宽比。
我在转发功能中所做的第一步是 x = Noise.view(32,3,12,8) 但是,这是一个运行时错误,表明噪声函数中的元素数量不等于重新整形的值。如果我将通道数从 3 替换为 1,它会起作用,但我想将图像保留为 RGB 格式。请问有什么线索吗?
这是代码的非常简单的表示
import torch
noise = torch.randn(32, 96)
x = noise.view(32,3,8, 12)
错误是:
RuntimeError: shape '[32, 3, 8, 12]' is invalid for input of size 3072
谢谢你:)
view 是噪声变量的简单重塑张量,无论如何它都可能是 32 * 96 个值,这就是你收到错误的原因