通过在卷积神经网络中使用平均池来理解对分辨率的影响。

问题描述 投票:0回答:1

我使用的是 colorization CIFAR-10数据集上的代码,我遇到了这一行。

downsize_module = nn.Sequential(nn.AvgPool2d(2), nn.AvgPool2d(2),  nn.Upsample(scale_factor=2), .Upsample(scale_factor=2))

"平均池化 "用了两次,那什么是 "平均池化"?resolution of output image?

这是我的理解。

例如,如果我们有 8*8 原始输入图像,第1个平均池(2*2)将给出4*4作为输出,第2个平均池(2*2)将给出2*2作为输出。

输出图像的分辨率是=116的输入图像的像素.所以,在像素方面,它将是原始的116th,但在维度方面,它将是原始的14。

哪种说法是正确的?是以像素为单位的116倍,还是以尺寸为单位的14倍。

resolution cnn pooling
1个回答
1
投票

在这两种情况下,你给出的信息是一样的,你只需要指定你所说的单位。边缘的像素或像素总数。如果你的图像是正方形的,那么总的像素数的比例是边缘像素数的平方。通常,当提到总像素数时(例如在摄影中),通常会看到这样的数字。分辨率=10.4Mp或3.2kp. 另一方面,当谈到屏幕时,分辨率通常是指图像的高度,以像素为单位,例如:分辨率=1080意味着图像的高度为1920像素,或3.2kp。分辨率=1080意味着1920x1080像素的图像。

© www.soinside.com 2019 - 2024. All rights reserved.