在 pytorch 网站上,他们的教程中有以下模型
class BasicCNN(nn.Module):
def __init__(self):
super(BasicCNN, self).__init__()
self.conv1 = nn.Conv2d(3, 6, 5)
self.pool = nn.MaxPool2d(2, 2)
self.conv2 = nn.Conv2d(6, 16, 5)
self.fc1 = nn.Linear(16 * 5 * 5, 120)
self.fc2 = nn.Linear(120, 84)
self.fc3 = nn.Linear(84, 10)
def forward(self, x):
x = x.permute(0, 3, 1, 2)
x = self.pool(F.relu(self.conv1(x)))
x = self.pool(F.relu(self.conv2(x)))
x = x.view(-1, 16 * 5 * 5)
x = F.relu(self.fc1(x))
x = F.relu(self.fc2(x))
x = self.fc3(x)
return x
该模型有多少个内核/过滤器?是两个吗 - 例如 conv1 和 conv2。如何通过指定过滤器的数量轻松创建多个过滤器?例如 100 个过滤器。
谢谢!
你的问题有点含糊,但让我试着回答一下。
通常,在卷积层中,我们将滤波器的数量设置为
out_channels
的数量。但这并不简单。让我们根据您提供的示例进行讨论。
什么是卷积层参数?
model = BasicCNN()
for name, params in model.named_parameters():
if 'conv' in name:
print(name, params.size())
输出:
conv1.weight torch.Size([6, 3, 5, 5])
conv1.bias torch.Size([6])
conv2.weight torch.Size([16, 6, 5, 5])
conv2.bias torch.Size([16])
说明
让我们考虑上述模型中的
conv1
层。我们可以说,有 6 个形状为 3 x 5 x 5
的滤波器,因为我们选择了 2d 卷积并且输入通道数为 3。所以总共有 6 个内核。
这里,该模型的输入是类似 3D 的图像。你可以考虑一下,我们有形状为
W x H
的图像,并且图像有 3 个通道 (RGB)。因此,我们可以将表示图像的 3D 张量提供给该模型。
现在回到您的问题,“如何通过指定数量轻松创建多个过滤器?例如 100 个过滤器。”。如果您只想在每个输入通道使用 100 个滤波器,则只需在
conv1
而不是 6
中设置 100 即可。这通常是人们在计算机视觉中所做的事情!
但是您绝对可以根据需要修改架构并确定最佳设置。